CUA 连系了 GPT-4o 的视觉能力和强化进修的高级推理能力,使其可以或许取 GUI 界面交互。
当碰到问题或犯错时,Operator 能操纵本身的推理能力进行纠错。若是无决问题,它会将节制权交回用户。2025年将成为智能体之年。
Operator 能够识别网页界面内容,键盘完成所有答应的操做,从而实现从动化操做?。
1月24日动静,今日凌晨,OpenAI发布了首款智能体产物“Operator”。这一功能是一款可以或许模仿人类操做网页浏览器的AI帮手,支撑从动完成旅行住宿预订、餐厅预定和正在线购物等复杂使命。可以或许通过互联网从动为用户施行多种使命。