1、 腾讯云文智自然语言处理API文档产品文档API文档产品文档【版权声明】2015-2016 腾讯云版权所有本文档著作权归腾讯云单独所有,未经腾讯云事先书面许可,任何主体不得以任何形式复制、修改、抄袭、传播全部或部分本文档内容。【商标声明】及其它腾讯云服务相关的商标均为腾讯云计算(北京)有限责任公司及其关联公司所有。本文档涉及的第三方主体的商标,依法由权利人所有。【服务声明】本文档意在向客户介绍腾讯云全部或部分产品、服务的当时的整体概况,部分产品、服务的内容可能有所调整。您所购买的腾讯云产品、服务的种类、服务标准等应由您与腾讯云之间的商业合同约定,除非双方另有约定,否则,腾讯云对本文档内容不做任
2、何明示或模式的承诺或保证。第2页 共60页版权所有:腾讯云计算(北京)有限责任公司API文档产品文档文档目录文档声明 . 2简介 . 4API概览 . 5调用方式 . 6请求结构 6接口鉴权 8公共参数 17返回值 . 19返回值结构 19错误码 21异步任务接口返回格式 . 22API调用快速上手指南 24通用API相关接口 . 28分词$srcStr = GET = base64_encode(hash_hmac(sha256, $srcStr, $secretKey, true);echo $signStr;最终得到的签名串为:0EEm/HtGRr/VJXTAD9tYMth1Bzm3lL
3、Hz5RCDv1GdM8s=同理,当您指定签名算法为 HmacSHA1 时,生成签名串的代码如下:$secretKey = Gu5t9xGARNpq86cd98joQYCN3Cozk1qA;$srcStr = GET = base64_encode(hash_hmac(sha1, $srcStr, $secretKey, true);第14页 共60页版权所有:腾讯云计算(北京)有限责任公司API文档产品文档echo $signStr;最终得到的签名串为:nPVnY6njQmwQ8ciqbPl5Qe+Oru4=签名串编码生成的签名串并不能直接作为请求参数,需要对其进行 URL 编码。如上一步生
4、成的签名串为0EEm/HtGRr/VJXTAD9tYMth1Bzm3lLHz5RCDv1GdM8s=,则其编码后为0EEm%2FHtGRr%2FVJXTAD9tYMth1Bzm3lLHz5RCDv1GdM8s%3D。因此,最终得到的签名串请求参数 (Signature) 为:0EEm%2FHtGRr%2FVJXTAD9tYMth1Bzm3lLHz5RCDv1GdM8s%3D,它将用于生成最终的请求URL。注意:如果用户的请求方法是 GET,则对所有请求参数的参数值均需要做 URL编码;此外,部分语言库会自动对 URL 进行编码,重复编码会导致签名校验失败。鉴权失败第15页 共60页版权所有:腾
5、讯云计算(北京)有限责任公司API文档产品文档当鉴权不通过时,可能出现如下表的错误:错误代码 错误类型 错误描述4100 身份认证失败 身份验证失败,请确保您请求参数中的 Signature按照上述步骤计算正确,特别注意Signature 要做 url编码后再发起请求。4101 未被开发商授权访问本接口 该子用户未被授权调用此接口。请联系开发商授权,详情请查阅 授权策略。4102 未被开发商授权访问本接口中所操作的资源第16页 共60页版权所有:腾讯云计算(北京)有限责任公司API文档产品文档公共参数公共参数是用于标识用户和接口鉴权目的的参数, 如非必要,在每个接口单独的接口文档中不再对这些参
6、数进行说明, 但每次请求均需要携带这些参数, 才能正常发起请求。名称 类型 描述 必选Action String 接口指令的名称,例如:LexicalAnalysis是Region String 区域参数,用来标识希望操作哪个区域的实例。可选:bj:北京gz:广州sh:上海hk:香港ca:北美是Timestamp UInt 当前UNIX时间戳 是Nonce UInt 随机正整数,与Timestamp 联合起来,用于防止重放攻击是SecretId String 由腾讯云平台上申请的标识身份的 SecretId 和SecretKey, 其中SecretKey 会用来生成Signature具体参考
7、接口鉴权 页面是Signature String 请求签名,用来验证此次请求的合法性,具体参考 接口鉴权 页面是一个典型的接口请求如下, Action=LexicalAnalysis表示分词sh:上海;hk:香港;等部分云产品并非每个区域都有提供,获取产品对应的地域列表可以使用/v2/DescribeProductRegionList是Timestamp UInt 当前UNIX时间戳 是Nonce UInt 随机正整数,与Timestamp联合起来, 用于防止重放攻击 是SecretId String 由腾讯云平台上申请的标识身份的SecretId和SecretKey,其中SecretKey会
8、用来生成Signature具体参考接口鉴权页面是Signature String 请求签名,用来验证此次请求的合法性具体参考接口鉴权页面是第24页 共60页版权所有:腾讯云计算(北京)有限责任公司API文档产品文档公共参数详见腾讯云公共参数2.3 接口鉴权接口鉴权方法详见接口鉴权注意:在生成签名的过程中,需要将加密字符串中包含的“_”改写成“.”,从而加密产生签名。2.4 异步任务接口返回格式详见腾讯云异步任务接口返回格式2.5 错误码详见调用方式-返回值-错误码3 调用示例这里将以一个简单的情感分析任务为例,介绍腾讯云SDK文智模块的使用。3.1 首先请在腾讯云官方SDK下载地址下载或更新最
9、新版本的SDK(本次以php-sdk为例)从 github 获取最新版本SDK (推荐)点击此处下载 SDK 3.2 修改demo.php文件,修改点如下a) SecretId,SecretKey改为自己腾讯云上相应的值,这里查看:第25页 共60页版权所有:腾讯云计算(北京)有限责任公司API文档产品文档http:/ limit=3); 改为:$package = array(“content“=“李亚鹏挺王菲:加油!孩儿他娘。“);说明:这是文智情感分析接口的参数。c)$a=$cvm-DescribeInstances($package); 改为:$a = $wenzhi-TextSent
10、iment($package); 说明:这是文智模块的相关接口,具体请查看接口列表:http:/ = 你在腾讯云上的SecretKey,RequestMethod = POST,DefaultRegion = gz);$wenzhi = QcloudApi:load(QcloudApi:MODULE_WENZHI, $config);$package = array(“content“=“李亚鹏挺王菲:加油!孩儿他娘。“);$a = $wenzhi-TextSentiment($package);第26页 共60页版权所有:腾讯云计算(北京)有限责任公司API文档产品文档if ($a = fa
11、lse) $error = $wenzhi-getError();echo “Error code:“ . $error-getCode() . “.n“;echo “message:“ . $error-getMessage() . “.n“;echo “ext:“ . var_export($error-getExt(), true) . “.n“; else var_dump($a);echo “nRequest :“ . $wenzhi-getLastRequest();echo “nResponse :“ . $wenzhi-getLastResponse();echo “n“;第2
12、7页 共60页版权所有:腾讯云计算(北京)有限责任公司API文档产品文档通用API相关接口分词&命名实体识别API1. 接口描述域名:接口名: LexicalAnalysis提供智能分词(基本词和短语)、词性标注、命名实体识别功能。专业的团队对数据、模型、程序进行迭代更新以保证效果的不断提升。用户只需简单的调用相关API接口即可获取到所需结果,无需担心诸如新词发现、歧义消除、调用性能等词法分析难题。词法分析已经为应用宝搜索、微信公共账号搜索等业务提供支持,均取得了良好的效果。2. 输入参数参数名称 必选类型 描述text 是 String 待词法分析的文本code 是 Int text的编码(
13、0x00200000=utf-8) 目前文智统一输入为utf-8type 否 Int 取值0或1,默认为0。0为基础粒度版分词,倾向于将句子切分的更细,在搜索场景使用为佳。1为混合粒度版分词,倾向于保留更多基本短语不被切分开。3. 输出参数参数名称 类型 描述code Int 错误码。0: 成功,其他值: 失败message String 错误信息tokens Array 分词结果 其中Array元素包含以下字段word String 切分出来的基础词pos UInt32 该基础词在文本中的起始位置wtype String 基础词的词性wlen Uint64 该基础词的长度combtokens
14、 Array 命名实体识别结果 其中Array元素包含以下字段第28页 共60页版权所有:腾讯云计算(北京)有限责任公司API文档产品文档word String 实体词pos UInt32 该实体在文本中的起始位置wlen UInt64 该实体词的长度基础词的词性cls Int32 人名 100000010/100000011地名 100000012机构名 1000000134. 示例输入https:/ 0,“message“: “,“combtokens“: “cls“: “短语“,“pos“: 0,“wlen“: “8“,“word“: “我爱洗澡“第29页 共60页版权所有:腾讯云计算(北京)有限责任公司API文档产品文档,“tokens“: “pos“: 0,“wlen“: “2“,“word“: “我“,“wtype“: “代词“,“wtype_pos“: 27,“pos“: 2,“wlen“: “2“,“word“: “爱“,“wtype“: “动词“,“wtype_pos“: 31,“pos“: 4,“wlen“: “4“,“word“: “洗澡“,“wtype“: “动词“,“wtype_pos“: 31第30页 共60页版权所有:腾讯云计算(北京)有限责任公司