response_format в вашем запросе, вы можете настроить вывод так, чтобы он наилучшим образом соответствовал вашим потребностям, будь то простой текст, структурированные данные или готовые к использованию файлы субтитров. Выбор srt или vtt дает не просто текст с таймингами; эти форматы предоставляют оформленные субтитры, автоматически оптимизированные для комфортного чтения и восприятия на экране. Примеры использования API смотрите в документации API.
API поддерживает следующие форматы вывода:
json: Возвращает стандартный JSON-объект, содержащий транскрибированный текст.text: Возвращает транскрипцию в виде одной строки простого текста.verbose_json: Возвращает подробный JSON-объект, содержащий текст, язык, продолжительность, а также, возможно, временные метки на уровне сегментов и слов (если запрошено черезtimestamp_granularities[]).srt: Возвращает транскрипцию, отформатированную как файл субтитров SRT.vtt: Возвращает транскрипцию, отформатированную как файл субтитров WebVTT.
Когда запрашиваете ответ в формате субтитров, (
srt или vtt) не используйте response.text если делаете запрос через request библиотеку в Python. Используйте response.json, как и для остальных форматов ответа.