오픈AI, AI 음성대화 개발자 도구 출시


홈 > 로컬뉴스 > 로컬뉴스
로컬뉴스

오픈AI, AI 음성대화 개발자 도구 출시

웹마스터

AI 생성 응답 개선 미세조정 도구 선보여


'챗GPT' 개발사인 오픈AI가 애플리케이션 개발자들을 대상으로 인공지능(AI) 모델의 음성 대화 환경을 전보다 쉽고 빠르게 구축할 수 있는 도구를 내놓았다.


오픈AI는 1일 개발자가 AI 모델을 기반으로 앱에서 음성 대화 서비스를 만들 때 이용할 수 있는 도구인 '실시간(Realtime) API(응용프로그램 인터페이스)'와 '대화 완성(Chat Completions) API'를 공개한다고 밝혔다.


이 도구를 이용하면 개발자가 여러 모델을 조합하는 과정을 거칠 필요 없이 단 한 번의 API 조작으로 자연스러운 대화 환경을 구축할 수 있다고 회사 측은 설명했다.


이전까지 개발자가 이런 AI 음성 지원 환경을 만들려면 자동 음성 인식 모델을 이용해 음성을 텍스트로 변환한 뒤 이를 텍스트 추론 모델에 전달하고 그 추론 결과를 다시 텍스트-음성 변환 모델에 넣어 재생하는 방식을 써야 했다.


이런 번거로운 방식은 이용자가 AI 챗봇을 이용할 때 답을 얻기까지 대기 시간을 늘리고 답변에 섞인 감정이나 강조하는 악센트 등이 손실되는 측면이 있었다고 오픈AI는 전했다.


회사 측은 이번에 공개한 도구들이 고객 지원 상담이나 언어 학습 보조 기능 등을 강화하는 데 쓰일 수 있다고 소개했다.


오픈AI는 또 개발자가 AI 생성 이미지나 텍스트를 더 개선할 수 있게 해주는 도구인 '미세조정(fine-tuning) API'도 선보였다.


이 도구는 향상된 시각 검색과 물체 감지 등의 기능으로 대상 이미지를 더 잘 이해하는 능력을 제공해 차량 자율주행 분야에서도 쓰일 수 있다고 회사 측은 설명했다.


아울러 오픈AI는 대규모 AI 모델을 이용해 상대적으로 작은 모델을 학습시킬 수 있게 하고 이전에 처리한 텍스트 AI 정보를 재사용할 수 있게 해주는 '프롬프트 캐싱'(Prompt Caching) 기능도 소개했다.


이 기능을 이용하면 개발자들의 작업 시간이 더 빨라지고 비용을 50% 절감할 수 있다는 것이 회사 측의 설명이다.


오픈AI의 주요 수익원은 자체 앱 개발에 첨단 AI 모델을 이용하려는 기업 고객들이다.


최근 기술업계에서 AI 모델 개발 경쟁이 점점 더 치열해지는 가운데 오픈AI는 기업 고객을 유인할 새로운 AI 도구와 기능을 출시하는 데 총력을 기울이고 있다.

0 Comments