Day4-人工智能开发

人工智能在音频、视觉、多模态领域的应用

假设你现在已经面试结束，需要针对于你自己的面试内容进行复盘。为了提高复盘效率，你把语音直接转换成了文字。

提前准备一段不超过 1 分钟的音频，可以是任何内容（不能涉黄、牵涉暴力与政治内容），使用人工智能模型，将其转换为文本。

注意：初始化 client 请使用以下代码

client = OpenAI(base_url="https://apitoken.ceba.ceshiren.com/openai/v1/"
                , api_key="你的token",)

假设你现在需要拍摄 vlog，vlog 的画面和声音是分开的。你已经准备好了 vlog 的配音文字，需要将它转换成成语音。

提前准备一段不超过 100 字的文本，可以是任何内容（不能涉黄、牵涉暴力与政治内容），使用人工智能模型，将其转换为语音。

注意：初始化 client 请使用以下代码

client = OpenAI(base_url="https://apitoken.ceba.ceshiren.com/openai/v1/"
                , api_key="你的token",)

请输入一段你准备好的文字（英文），判断情感是积极的还是消极的。

参考相关知识点教程：音频转文字

参考相关知识点教程：文字转语音

参考相关知识点教程：图像识别