python调用百度AI接口实现自然语言处理。
@[toc]
新建项目
https://blog.csdn.net/weixin_46530492/category_10365069.html
新建AipNlp
from aip import AipNlp
import json
""" 你的 APPID AK SK """
APP_ID = '23694141'
API_KEY = 'bEKvNrzIat2w5Xs4fSDBKAfq'
SECRET_KEY = 'xxxxxxxxxxxx'
client = AipNlp(APP_ID, API_KEY, SECRET_KEY)
接口说明
评论观点抽取
评论观点抽取接口用来提取一条评论句子的关注点和评论观点,并输出评论观点标签及评论观点极性。
情感倾向分析
对包含主观观点信息的文本进行情感极性类别(积极、消极、中性)的判断,并给出相应的置信度。
text = "苹果是一家伟大的公司"
""" 调用情感倾向分析 """
dic = client.sentimentClassify(text);
print(json.dumps(dic,ensure_ascii=False,sort_keys=True, indent=4, separators=(',', ': ')))
{
"items": [
{
"confidence": 0.997489,
"negative_prob": 0.00112987,
"positive_prob": 0.99887,
"sentiment": 2
}
],
"log_id": 3192513341866407737,
"text": "苹果是一家伟大的公司"
}
文章标签
文章标签服务能够针对网络各类媒体文章进行快速的内容理解,根据输入含有标题的文章,输出多个内容标签以及对应的置信度,用于个性化推荐、相似文章聚合、文本内容分析等场景。
title = "iphone手机出现“白苹果”原因及解决办法,用苹果手机的可以看下"
content = "如果下面的方法还是没有解决你的问题建议来我们门店看下成都市锦江区红星路三段99号银石广场24层01室。"
""" 调用文章标签 """
dic = client.keyword(title, content)
print(json.dumps(dic,ensure_ascii=False,sort_keys=True, indent=4, separators=(',', ': ')))
{
"items": [
{
"score": 0.99775,
"tag": "iphone"
},
{
"score": 0.862602,
"tag": "手机"
},
{
"score": 0.845657,
"tag": "苹果"
},
{
"score": 0.837886,
"tag": "苹果公司"
},
{
"score": 0.801252,
"tag": "白苹果"
},
{
"score": 0.797911,
"tag": "数码"
}
],
"log_id": 7392338802443196121
}
文章分类
对文章按照内容类型进行自动分类,首批支持娱乐、体育、科技等26个主流内容类型,为文章聚类、文本内容分析等应用提供基础技术支持。
title = "欧洲冠军杯足球赛"
content = "欧洲冠军联赛是欧洲足球协会联盟主办的年度足球比赛,代表欧洲俱乐部足球最高荣誉和水平,被认为是全世界最高素质、最具影响力以及最高水平的俱乐部赛事,亦是世界上奖金最高的足球赛事和体育赛事之一。"
""" 调用文章分类 """
dic = client.topic(title, content);
print(json.dumps(dic,ensure_ascii=False,sort_keys=True, indent=4, separators=(',', ': ')))
{
"item": {
"lv1_tag_list": [
{
"score": 0.830915,
"tag": "体育"
}
],
"lv2_tag_list": [
{
"score": 0.915631,
"tag": "足球"
},
{
"score": 0.803507,
"tag": "国际足球"
},
{
"score": 0.77813,
"tag": "英超"
}
]
},
"log_id": 4032705288703185305
}
文本纠错
识别输入文本中有错误的片段,提示错误并给出正确的文本结果。支持短文本、长文本、语音等内容的错误识别,纠错是搜索引擎、语音识别、内容审查等功能更好运行的基础模块之一。
text = "百度是一家人工只能公司"
""" 调用文本纠错 """
dic = client.ecnet(text);
print(json.dumps(dic,ensure_ascii=False,sort_keys=True, indent=4, separators=(',', ': ')))
{
"item": {
"correct_query": "百度是一家人工智能公司",
"score": 0.797593,
"vec_fragment": [
{
"begin_pos": 10,
"correct_frag": "人工智能公司",
"end_pos": 22,
"ori_frag": "人工只能公司"
}
]
},
"log_id": 2703019807768401785,
"text": "百度是一家人工只能公司"
}
可以简化最后一行为
print(dic['item']['correct_query'])
这样输出的结果只有
百度是一家人工智能公司
对话情绪识别接口
针对用户日常沟通文本背后所蕴含情绪的一种直观检测,可自动识别出当前会话者所表现出的情绪类别及其置信度,可以帮助企业更全面地把握产品服务质量、监控客户服务质量。
client = AipNlp(APP_ID, API_KEY, SECRET_KEY)
text = "本来今天高高兴兴"
""" 调用对话情绪识别接口 """
dic = client.emotion(text);
print(json.dumps(dic,ensure_ascii=False,sort_keys=True, indent=4, separators=(',', ': ')))
{
"items": [
{
"label": "optimistic",
"prob": 0.501008,
"replies": [
"笑一笑十年少"
],
"subitems": [
{
"label": "happy",
"prob": 0.501008
}
]
},
{
"label": "neutral",
"prob": 0.49872,
"replies": [],
"subitems": []
},
{
"label": "pessimistic",
"prob": 0.000272128,
"replies": [],
"subitems": []
}
],
"log_id": 5337498598844391481,
"text": "本来今天高高兴兴"
}
新闻摘要接口
自动抽取新闻文本中的关键信息,进而生成指定长度的新闻摘要。
地址识别接口
针对快递、电商行业中客户在线提交的大量非结构化地址单据,该接口可以帮助精准提取快递填单文本中的姓名、电话、地址信息,通过自然语言处理辅助地址识别做自动补充和纠正,生成标准规范的结构化信息,大幅提升企业处理单据的效率。
client = AipNlp(APP_ID, API_KEY, SECRET_KEY)
text = "上海市浦东新区纳贤路701号百度上海研发中心 F4A000 张三"
""" 调用地址识别接口 """
dic = client.address(text);
print(json.dumps(dic,ensure_ascii=False,sort_keys=True, indent=4, separators=(',', ': ')))
{
"province": "上海市",
"city": "上海市",
"province_code": "310000",
"log_id": 1420038644986026316,
"text": "上海市浦东新区纳贤路701号百度上海研发中心 F4A000 张三",
"town": "张江镇",
"phonenum": "",
"detail": "纳贤路701号百度上海研发中心F4A000",
"county": "浦东新区",
"person": "张三",
"town_code": "310115125",
"county_code": "310115",
"city_code": "310100"
}
网友评论