오픈AI, AI 음성대화 개발자 도구 출시
AI 생성 응답 개선 미세조정 도구 선보여
'챗GPT' 개발사인 오픈AI가 애플리케이션 개발자들을 대상으로 인공지능(AI) 모델의 음성 대화 환경을 전보다 쉽고 빠르게 구축할 수 있는 도구를 내놓았다.
오픈AI는 1일 개발자가 AI 모델을 기반으로 앱에서 음성 대화 서비스를 만들 때 이용할 수 있는 도구인 '실시간(Realtime) API(응용프로그램 인터페이스)'와 '대화 완성(Chat Completions) API'를 공개한다고 밝혔다.
이 도구를 이용하면 개발자가 여러 모델을 조합하는 과정을 거칠 필요 없이 단 한 번의 API 조작으로 자연스러운 대화 환경을 구축할 수 있다고 회사 측은 설명했다.
이전까지 개발자가 이런 AI 음성 지원 환경을 만들려면 자동 음성 인식 모델을 이용해 음성을 텍스트로 변환한 뒤 이를 텍스트 추론 모델에 전달하고 그 추론 결과를 다시 텍스트-음성 변환 모델에 넣어 재생하는 방식을 써야 했다.
이런 번거로운 방식은 이용자가 AI 챗봇을 이용할 때 답을 얻기까지 대기 시간을 늘리고 답변에 섞인 감정이나 강조하는 악센트 등이 손실되는 측면이 있었다고 오픈AI는 전했다.
회사 측은 이번에 공개한 도구들이 고객 지원 상담이나 언어 학습 보조 기능 등을 강화하는 데 쓰일 수 있다고 소개했다.
오픈AI는 또 개발자가 AI 생성 이미지나 텍스트를 더 개선할 수 있게 해주는 도구인 '미세조정(fine-tuning) API'도 선보였다.
이 도구는 향상된 시각 검색과 물체 감지 등의 기능으로 대상 이미지를 더 잘 이해하는 능력을 제공해 차량 자율주행 분야에서도 쓰일 수 있다고 회사 측은 설명했다.
아울러 오픈AI는 대규모 AI 모델을 이용해 상대적으로 작은 모델을 학습시킬 수 있게 하고 이전에 처리한 텍스트 AI 정보를 재사용할 수 있게 해주는 '프롬프트 캐싱'(Prompt Caching) 기능도 소개했다.
이 기능을 이용하면 개발자들의 작업 시간이 더 빨라지고 비용을 50% 절감할 수 있다는 것이 회사 측의 설명이다.
오픈AI의 주요 수익원은 자체 앱 개발에 첨단 AI 모델을 이용하려는 기업 고객들이다.
최근 기술업계에서 AI 모델 개발 경쟁이 점점 더 치열해지는 가운데 오픈AI는 기업 고객을 유인할 새로운 AI 도구와 기능을 출시하는 데 총력을 기울이고 있다.