OpenAI는 웹 브라우저 내에서 탐색할 수 있는 Operator라는 새로운 도구를 미리 선보이기 시작했습니다. 블로그 게시물에 따르면 목요일에 게시됨소프트웨어는 회사에서 컴퓨터 사용 에이전트라고 부르는 것에 의해 구동됩니다. 모델의 OpenAI는 “CUA는 사람들이 화면에서 보는 버튼, 메뉴, 텍스트 필드인 그래픽 사용자 인터페이스(GUI)와 상호 작용하도록 훈련되었습니다.”라고 말합니다. “이를 통해 OS 또는 웹 관련 API를 사용하지 않고도 디지털 작업을 수행할 수 있는 유연성을 얻을 수 있습니다.”
Operator의 현재 릴리스는 OpenAI의 GPT-4o 모델을 기반으로 구축되었습니다. 해당 알고리즘의 비전 기능과 강화 학습을 통해 훈련된 ‘고급 추론’을 결합합니다. 운영자는 “작업을 다단계 계획으로 나누고 문제가 발생할 때 적응적으로 자체 수정”할 수 있는 능력을 가지고 있습니다. OpenAI에 따르면 이 기능은 AI 개발의 다음 단계를 나타냅니다.
OpenAI는 Operator를 월 $200의 사용자에게 처음으로 제공합니다. ChatGPT Pro 구독. 등의 기업과도 제휴를 맺고 있습니다. 인스타카트 플랫폼에서 에이전트를 제공하려면 통합을 테스트하려면 ChatGPT Pro 구독이 필요합니다.
Operator는 웹 브라우저나 전체 운영 체제를 탐색할 수 있는 점점 늘어나는 AI 에이전트 목록에 합류합니다. Anthropic은 출시를 통해 이 기능을 최초로 제공했습니다. 클로드 3.5 소네트 10월 모델최근에는 Google이 그 뒤를 이었습니다. 제미니 2.0 모델과 프로젝트 마리너.
본 글의 링크를 통해 상품을 구매하시면 커미션을 받으실 수 있습니다.
댓글