WebWorld-8B快速上手指南:5分钟搭建你的第一个网页代理模拟环境
WebWorld-8B快速上手指南5分钟搭建你的第一个网页代理模拟环境【免费下载链接】WebWorld-8B项目地址: https://ai.gitcode.com/hf_mirrors/Qwen/WebWorld-8BWebWorld-8B是一款基于Qwen3-8B开发的网页代理模拟环境能够帮助开发者快速构建真实的网页交互场景。通过这款强大的开源工具你可以轻松实现长达30步以上的长周期网页操作模拟支持多种格式的状态表示包括A11y Tree、HTML、XML、Markdown和自然语言等。 为什么选择WebWorld-8BWebWorld-8B作为一款先进的网页代理模拟环境具有以下显著优势高效模拟基于100万真实网页交互轨迹训练能够精准预测网页状态变化多格式支持兼容多种网页状态表示格式满足不同场景需求长周期操作支持30步以上的连续网页操作模拟跨域泛化可应用于代码、GUI和游戏等多种环境 环境准备在开始使用WebWorld-8B之前你需要确保系统中已安装以下依赖Python 3.8transformers建议使用最新版本torch可选accelerate、vllm用于高效服务 快速安装1. 克隆仓库首先克隆WebWorld-8B项目仓库到本地git clone https://gitcode.com/hf_mirrors/Qwen/WebWorld-8B cd WebWorld-8B2. 安装依赖使用pip安装所需依赖pip install transformers torch # 如需高效服务可额外安装 pip install accelerate vllm 开始使用WebWorld-8B单步预测WebWorld-8B最基本的功能是根据当前页面状态和操作预测下一个页面状态。以下是一个简单的单步预测示例点击查看代码示例import torch from transformers import AutoTokenizer, AutoModelForCausalLM model_name Qwen/WebWorld-8B tokenizer AutoTokenizer.from_pretrained(model_name, trust_remote_codeTrue) model AutoModelForCausalLM.from_pretrained( model_name, device_mapauto, torch_dtypetorch.bfloat16, trust_remote_codeTrue, ).eval() system_prompt ( You are a web world model. I will provide you with an initial page state and a sequence of actions. For each action, predict the resulting page state.\n Strictly maintain the original format. Output only the full page state without explanations, code, or truncation. ) # 当前页面状态 current_state RootWebArea Global Start - Your Daily Portal, focused \t[1] banner Top Header, visible \t\t[2] link Set as Homepage, clickable, visible \t\t[3] link Feedback, clickable, visible \t\t[5] region Weather Widget, visible \t\t\tStaticText New York, USA \t\t\t[6] image Sunny, visible \t\t\tStaticText 24°C \t\t[8] link Sign In, clickable, visible \t[10] region Search Area, visible \t\t[11] image Global Start Logo, visible \t\tStaticText Search the entire web \t\t[12] tablist Search Engine Selector, orientationhorizontal \t\t\t[13] tab Google, selectedTrue, clickable \t\t\t[14] tab Bing, selectedFalse, clickable \t\t\t[15] tab DuckDuckGo, selectedFalse, clickable \t\t[18] combobox Web Search, clickable, visible, autocompleteboth, expandedFalse \t\t\t[19] textbox Type keywords or URL..., clickable, visible, editable, value \t\t[20] button Search, clickable, visible \t[30] navigation Category Bar, visible \t\t[31] link Home, clickable, selectedTrue \t\t[32] link News, clickable \t\t[33] link Video, clickable \t\t[34] link Shopping, clickable \t\t[35] link Social, clickable \t[50] main Site Directory, visible \t\t[51] region Top Recommended, visible \t\t\t[52] heading Most Popular, visible \t\t\t[53] list Top Sites Grid, visible \t\t\t\t[54] link Facebook, clickable \t\t\t\t[56] link YouTube, clickable \t\t\t\t[58] link Amazon, clickable \t\t\t\t[60] link Twitter / X, clickable \t\t\t\t[62] link Instagram, clickable \t\t\t\t[64] link Wikipedia, clickable \t\t\t\t[66] link Netflix, clickable \t\t\t\t[68] link LinkedIn, clickable \t\t[80] region News Media, visible \t\t\t[81] heading Latest News, visible \t\t\t[82] link CNN, clickable \t\t\t[83] link BBC, clickable \t\t\t[84] link The Verge, clickable \t\t[90] region Shopping, visible \t\t\t[91] heading E-Commerce, visible \t\t\t[92] link eBay, clickable \t\t\t[93] link Walmart, clickable \t\t\t[94] link Best Buy, clickable \t[200] complementary Ads, visible \t\t[201] image Ad: Travel to Japan \t\t[202] link Book Now, clickable \t[300] contentinfo Footer, visible \t\tStaticText © 2026 Global Start Inc. user_message ( fInitial Page State:\n{current_state}\n\n fFirst Action: click([32])\n\n fNext Page State: ) messages [ {role: system, content: system_prompt}, {role: user, content: user_message}, ] text tokenizer.apply_chat_template(messages, tokenizeFalse, add_generation_promptTrue) inputs tokenizer(text, return_tensorspt).to(model.device) with torch.no_grad(): outputs model.generate( **inputs, max_new_tokens4096, do_sampleFalse, ) response tokenizer.decode(outputs[0][inputs[input_ids].shape[-1]:], skip_special_tokensTrue) print(response)多轮模拟WebWorld-8B支持多轮连续模拟模拟完整的用户交互流程点击查看多轮模拟代码CONTINUE_PROMPT ( Continue the trajectory. Given the previous state, predict the next page state after this action.\n\n Action: {action}\n\nNext Page State: ) # 第一轮 messages [ {role: system, content: system_prompt}, {role: user, content: fInitial Page State:\n{state_0}\n\nFirst Action: {action_0}\n\nNext Page State:}, ] state_1 generate(messages) # 你的生成函数 # 第二轮 messages.append({role: assistant, content: state_1}) messages.append({role: user, content: CONTINUE_PROMPT.format(actionaction_1)}) state_2 generate(messages) # 第三轮、第四轮...最多支持30轮重复相同模式 messages.append({role: assistant, content: state_2}) messages.append({role: user, content: CONTINUE_PROMPT.format(actionaction_2)}) state_3 generate(messages) 支持的操作类型WebWorld-8B支持多种网页操作主要包括以下几类元素操作click(bid, button, modifiers): 点击DOM元素fill(bid, text, press_enter): 在输入框中输入文本select_option(bid, options): 从下拉框选择选项hover(bid): 悬停在元素上鼠标操作mouse_move(x, y): 移动鼠标到指定坐标mouse_click(x, y, button): 在指定坐标点击mouse_down(x, y)/mouse_up(x, y): 鼠标按下/释放键盘操作keyboard_press(key): 按下特定键keyboard_type(text): 输入文本浏览器操作scroll(dx, dy): 滚动视窗goto(url): 导航到指定URLgo_back()/go_forward(): 浏览器历史导航tab_new()/tab_close()/tab_focus(index): 标签页管理 性能表现WebWorld-8B在多个评估指标上表现优异内在评估WebWorld-Bench模型平均真实性平均图灵测试得分GPT-4o59.535.4Claude-Opus-4.171.347.4Gemini-3-Pro70.343.2Qwen3-8B (基础版)26.917.4WebWorld-8B70.142.2外在评估代理训练模型MiniWob 成功率WebArena 成功率GPT-4o64.3%26.6%Qwen3-8B (基础版)49.4%9.8%Qwen3-8B WebWorld59.3%(9.9%)20.7%(10.9%)⚠️ 注意事项使用WebWorld-8B时请注意以下限制过度乐观倾向模型可能生成对代理操作过于有利的结果内容生成保真度长文本、高精度内容如科学文章不是主要目标纯文本模拟WebWorld不模拟视觉/像素级渲染 配置文件说明WebWorld-8B提供了多个配置文件可根据需求进行调整config.json: 模型主要配置generation_config.json: 生成参数配置tokenizer_config.json: 分词器配置通过修改这些配置文件你可以调整模型的行为以适应不同的应用场景。 总结WebWorld-8B是一款功能强大的网页代理模拟环境能够帮助开发者快速构建和测试网页交互场景。通过本指南你已经了解了WebWorld-8B的基本安装和使用方法。现在你可以开始探索这个强大工具的更多高级功能构建自己的网页代理模拟环境了无论是进行网页自动化测试、开发智能网页代理还是研究网页交互模式WebWorld-8B都能为你提供高效、可靠的模拟环境支持。立即开始你的WebWorld-8B之旅吧【免费下载链接】WebWorld-8B项目地址: https://ai.gitcode.com/hf_mirrors/Qwen/WebWorld-8B创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考