# import json import cv2 import requests import uuid from tencentcloud.common import credential from tencentcloud.common.profile.client_profile import ClientProfile from tencentcloud.common.profile.http_profile import HttpProfile from tencentcloud.common.exception.tencent_cloud_sdk_exception import TencentCloudSDKException from tencentcloud.tts.v20190823 import tts_client from tencentcloud.tts.v20190823 import models as tts_models import numpy as np import base64 import matplotlib.pyplot as plt %matplotlib inline import warnings warnings.filterwarnings("ignore") SecretId="xxxxxxxxxxxxxxxxxxxxxxxxxx" SecretKey="xxxxxxxxxxxxxxxxxxxxxxxxxxx"
""" 长文语音合成请求 https://console.cloud.tencent.com/api /explorer?Product=tts&Version=2019-08-23&Action=CreateTtsTask&SignVersion= """ try: cred = credential.Credential(SecretId,SecretKey) httpProfile = HttpProfile() httpProfile.endpoint = "tts.tencentcloudapi.com" clientProfile = ClientProfile() clientProfile.httpProfile = httpProfile client = tts_client.TtsClient(cred, "", clientProfile) Text=""" 枣树,在家乡的房子前后,沟沟坡坡、路边街等地随处可见,密密麻麻地环绕着村庄, 就像站岗哨兵保卫村庄一样。 干裂的树皮、苍劲的躯干、嫩黄的枣花,油绿的树叶,红色的果实,都是我童年记忆中最深的风景。 """ req = tts_models.CreateTtsTaskRequest() params = {
"Text": Text, "Volume": 1,
"Speed": 0,
"ProjectId": 0,
"ModelType": 1,
"VoiceType": 101001,
"PrimaryLanguage": 1,
"SampleRate": 16000,
"Codec": "mp3",
"VoiceoverDialogueSplit": False
}
""" """
req.from_json_string(json.dumps(params))
resp = client.CreateTtsTask(req).to_json_string()
resp=json.loads(resp)
print(resp)
TaskId=resp["Data"]["TaskId"]
except TencentCloudSDKException as err:
print(err)
{'Data': {'TaskId': 'gz-91061d49-7ed8-455a-860e-eb8cb12e84d4'}, 'RequestId': '8777c60a-0b72-4185-8e3e-a947c21596aa'}
""" 是 String 公共参数,本接口取值:CreateTtsTask。 Version 是 String 公共参数,本接口取值:2019-08-23。 Region 否 String 公共参数,本接口不需要传递此参数。 Text 是 String 合成语音的源文本,按UTF-8编码统一计算,最多支持10万字符 ModelType 是 Integer 模型类型,1-默认模型。 Volume 否 Float 音量大小,范围:[0,10],分别对应11个等级的音量,默认为0,代表正常音量。没有静音选项。 输入除以上整数之外的其他参数不生效,按默认值处理。 Speed 否 Float 语速,范围:[-2,2],分别对应不同语速: -2代表0.6倍 -1代表0.8倍 0代表1.0倍(默认) 1代表1.2倍 2代表1.5倍 如果需要更细化的语速,可以保留小数点后一位,例如0.5 1.1 1.8等。 ProjectId 否 Integer 项目id,用户自定义,默认为0。 VoiceType 否 Integer 标准音色 1001-智瑜,情感女声(默认) 1002-智聆,通用女声 1003-智美,客服女声 1006-智云,通用男声 1050-WeJack,英文男声 1051-WeRose,英文女声 精品音色 精品音色拟真度更高,价格不同于普通音色,查看购买指南 101001-智瑜,情感女声(精品) 101002-智聆,通用女声(精品) 101003-智美,客服女声(精品) 101004-智云,通用男声 101005-智莉,通用女声 101006-智言,助手女声 101007-智娜,客服女声 101008-智琪,客服女声 101009-智芸,知性女声 101010-智华,通用男声 101011-智燕,新闻女声 101012-智丹,新闻女声 101013-智辉,新闻男声 101014-智宁,新闻男声 101015-智萌,男童声 101016-智甜,女童声 101017-智蓉,情感女声 101018-智靖,情感男声 101019-智彤,粤语女声 101050-WeJack,英文男声(精品) 101051-WeRose,英文女声(精品) PrimaryLanguage 否 Integer 主语言类型: 1-中文(默认) 2-英文 SampleRate 否 Integer 音频采样率: 16000:16k(默认) 8000:8k Codec 否 String 返回音频格式,可取值:mp3(默认),mp3,pcm CallbackUrl 否 String 回调 URL,用户自行搭建的用于接收识别结果的服务URL。如果用户使用轮询方式获取识别结果,则无需提交该参数。回调说明 """
'\n\t是\tString\t公共参数,本接口取值:CreateTtsTask。\nVersion\t是\tString\t公共参数,本接口取值:2019-08-23。\nRegion\t否\tString\t公共参数,本接口不需要传递此参数。\nText\t是\tString\t合成语音的源文本,按UTF-8编码统一计算,最多支持10万字符\nModelType\t是\tInteger\t模型类型,1-默认模型。\nVolume\t否\tFloat\t音量大小,范围:[0,10],分别对应11个等级的音量,默认为0,代表正常音量。没有静音选项。\n输入除以上整数之外的其他参数不生效,按默认值处理。\nSpeed\t否\tFloat\t语速,范围:[-2,2],分别对应不同语速:\n-2代表0.6倍\n-1代表0.8倍\n0代表1.0倍(默认)\n1代表1.2倍\n2代表1.5倍\n如果需要更细化的语速,可以保留小数点后一位,例如0.5 1.1 1.8等。\nProjectId\t否\tInteger\t项目id,用户自定义,默认为0。\nVoiceType\t否\tInteger\t标准音色\n1001-智瑜,情感女声(默认)\n1002-智聆,通用女声\n1003-智美,客服女声\n1006-智云,通用男声\n1050-WeJack,英文男声\n1051-WeRose,英文女声\n精品音色\n精品音色拟真度更高,价格不同于普通音色,查看购买指南\n101001-智瑜,情感女声(精品)\n101002-智聆,通用女声(精品)\n101003-智美,客服女声(精品)\n101004-智云,通用男声\n101005-智莉,通用女声\n101006-智言,助手女声\n101007-智娜,客服女声\n101008-智琪,客服女声\n101009-智芸,知性女声\n101010-智华,通用男声\n101011-智燕,新闻女声\n101012-智丹,新闻女声\n101013-智辉,新闻男声\n101014-智宁,新闻男声\n101015-智萌,男童声\n101016-智甜,女童声\n101017-智蓉,情感女声\n101018-智靖,情感男声\n101019-智彤,粤语女声\n101050-WeJack,英文男声(精品)\n101051-WeRose,英文女声(精品)\nPrimaryLanguage\t否\tInteger\t主语言类型:\n1-中文(默认)\n2-英文\nSampleRate\t否\tInteger\t音频采样率:\n16000:16k(默认)\n8000:8k\nCodec\t否\tString\t返回音频格式,可取值:mp3(默认),mp3,pcm\nCallbackUrl\t否\tString\t回调 URL,用户自行搭建的用于接收识别结果的服务URL。如果用户使用轮询方式获取识别结果,则无需提交该参数。回调说明\n'
""" https://console.cloud.tencent.com/api /explorer?Product=tts&Version=2019-08-23&Action=DescribeTtsTaskStatus&SignVersion= 长文本语音合成结果查询 """
try:
cred = credential.Credential(SecretId, SecretKey)
httpProfile = HttpProfile()
httpProfile.endpoint = "tts.tencentcloudapi.com"
clientProfile = ClientProfile()
clientProfile.httpProfile = httpProfile
client = tts_client.TtsClient(cred, "", clientProfile)
req = tts_models.DescribeTtsTaskStatusRequest()
params = {
"TaskId": TaskId
}
req.from_json_string(json.dumps(params))
resp = client.DescribeTtsTaskStatus(req).to_json_string()
resp=json.loads(resp)
print(resp)
except TencentCloudSDKException as err:
print(err)
{'Data': {'TaskId': 'gz-91061d49-7ed8-455a-860e-eb8cb12e84d4', 'Status': 2, 'StatusStr': 'success', 'ResultUrl': 'https://tts-async-audio-gz-1300466766.cos.ap-guangzhou.myqcloud.com/20210820%2F1304700566%2Fgz-91061d49-7ed8-455a-860e-eb8cb12e84d4.mp3?sign=q-sign-algorithm%3Dsha1%26q-ak%3DAKIDJXcaKs2w4vZw5zTCrHRM7dOwre9Xk9MJ%26q-sign-time%3D1629438920%3B1630043720%26q-key-time%3D1629438920%3B1630043720%26q-header-list%3D%26q-url-param-list%3D%26q-signature%3D797ffffd47228d209abbb502b03d92fb631afcf3', 'ErrorMsg': ''}, 'RequestId': '60da49ee-7a88-4a17-a80b-9f5b13d5bed2'}
with open("./video/output.wav",'wb') as file:
file.write(requests.get(resp["Data"]["ResultUrl"]).content)
""" https://console.cloud.tencent.com/api /explorer?Product=tts&Version=2019-08-23&Action=TextToVoice&SignVersion= 基础语音合成 """
try:
cred = credential.Credential(SecretId, SecretKey)
httpProfile = HttpProfile()
httpProfile.endpoint = "tts.tencentcloudapi.com"
clientProfile = ClientProfile()
clientProfile.httpProfile = httpProfile
client = tts_client.TtsClient(cred, "ap-beijing", clientProfile)
req = tts_models.TextToVoiceRequest()
Text="基础语音合成"
params = {
"Text": Text,
"SessionId": str(uuid.uuid4()),
"Volume": 1,
"Speed": 0,
"ProjectId": 0,
"ModelType": 1,
"VoiceType": 1003,
"PrimaryLanguage": 1,
"SampleRate": 16000,
"Codec": "mp3"
}
req.from_json_string(json.dumps(params))
resp = client.TextToVoice(req).to_json_string()
resp=json.loads(resp)
print(resp)
except TencentCloudSDKException as err:
print(err)
{'Audio': '', 'SessionId': '117631b6-064c-4a8d-b731-bfb3d7dda833', 'RequestId': '152876b1-7d19-4f70-a8ff-772acf2fcb9a'}
with open("./video/output.mp3",'wb') as file:
file.write(base64.b64decode(resp['Audio']))