使用 Azure 文本转语音服务,把用户的语音转换成文本,调用 Azure OpenAI 中的 text-davinci-003 模型实现对话,再把返回的文本转换成语音输出。配合 Live2D 的二维动画虚拟人把语音展现出来。