OpenAI представила нове покоління голосових моделей для перетворення тексту на мову

Компанія OpenAI анонсувала передові голосові моделі, які не лише конвертують текст у мовлення, а й дозволяють налаштовувати стиль, тембр і емоційність голосу.
Про це йдеться на сайті компанії.
Завдяки цьому штучний інтелект може імітувати різні манери мовлення – наприклад, говорити як пірат чи оповідач казок. Доступні як готові пресети, так і можливість задавати параметри вручну.
Окрім цього, OpenAI значно покращила технологію розпізнавання мовлення. Нові моделі gpt-4o-transcribe та gpt-4o-mini-transcribe стали точнішими у перетворенні усної мови на текст, навіть у складних умовах – при сильному акценті, фонового шуму чи змінної швидкості мовлення. Це робить взаємодію з ШІ більш природною та інтуїтивною.
Оновлені голосові моделі вже доступні розробникам через API і можуть бути інтегровані в різні застосунки та сервіси. Крім того, OpenAI надає можливість усім охочим протестувати нові можливості на спеціальній платформі.
Раніше стало відомо, що компанія планує запровадити преміум-доступ до своїх найпотужніших ШІ-моделей, вартість якого може сягати 1 мільйона гривень на місяць. Такі моделі будуть орієнтовані на підтримку наукових досліджень на рівні докторських дисертацій.
Наступним кроком OpenAI стане випуск GPT-5. Очікується, що це буде справжня революція у сфері штучного інтелекту – модель зможе опановувати будь-які завдання і вести діалог, практично не відрізняючись від людини.
Нагадаємо, OpenAI навчила нову модель ШІ писати якісні художні тексти
Олена Стебніцька - pravdatutnews.com





