美文网首页程序员@IT·互联网
自然语言处理(NLP)的初步理解

自然语言处理(NLP)的初步理解

作者: ExecutorofZero | 来源:发表于2024-02-04 16:06 被阅读0次

    什么是自然语言处理?

    NLP 代表自然语言处理。NLP 是人类语言、计算机科学和人工智能的一个子领域。NLP 的目标是向机器教授自然语言。这个想法不仅是机器应该理解,而且它们也应该交流。

    根据 Wikipedia 的定义,NLP [它是语言学、计算机科学和人工智能的一个子领域,涉及计算机与人类语言之间的交互,特别是如何对计算机进行编程以处理和分析大量自然语言数据]。

    NLP 的需求是什么?

    在神经心理学、语言学和语言哲学中,自然语言或普通语言是人类通过使用和重复而自然进化的任何语言,而无需有意识的计划或预谋。自然语言可以采用不同的形式,例如语音或手语。它们与诸如用于计算机编程或研究逻辑的构造语言和形式语言不同。

    简而言之,由于使用和重复而在人类中自发进化的任何语言,都被语言学、神经心理学和语言哲学视为自然语言或普通语言。自然语言不同于构造语言,如 Python、Java、C++ 编程语言。

    如果我们了解人类历史或人类进化史,我们注意到在几百万年之前我们就像动物一样,但快进几百万年,人类已经进化了。就像人类进入太空一样,他们使用各种技术,而动物们仍然在丛林中离开,并在数百万年中过着同样的生活。所以问题是我们(人类)做了什么而超越了动物。所以我认为有两个因素,第一个因素是沟通和语言。无论我们取得了什么成就,主要因素是我们能够相互交流,我们能够分享我们的想法。我们把很多想法从一代传到另一代,就像书籍一样。语言和交流有助于人类的成长和进化。第二个因素是机器的使用。我们为不同的域创建了很多机器。那台机器帮助人类越来越快地成长和进化。

    第三个因素是我们将能够与机器交流,就像我们与人类同胞交流一样。例如,想象一个我们与任何机器(例如 ATM)进行通信的世界。想象一个老人想从ATM机上取钱,但是他不懂界面。ATM机将帮助该人与机器进行通信并协助他取款。

    现实世界的应用

    我们在日常生活中使用的一些应用程序我们非常了解。Alexa、Siri、Cortana 和聊天机器人都是NLP 应用的示例。

    让我们讨论更多的 NLP 应用。

    a. 上下文广告:我们知道,在 90 年代,我们过去常常观看比赛、电影或连续剧,充满了各种广告。公司假设有人会购买该产品。但是今天,我们有了 NLP,我们可以处理和观察人们的行为方式,他是什么样的个性,所以我们可以在这里使用有针对性的广告。

    我们都知道,我们总是在社交网站上看到不同的广告。那么公司会做什么,他们会检查个人资料、帖子或分析评论,并根据他们确定此人对运动、技术或化妆品感兴趣。在此基础上,他们向我们展示了有针对性的广告。

    b. 电子邮件客户端(垃圾邮件过滤、智能回复):我们都知道垃圾邮件。在这种情况下,某家公司向我们发送了一封邮件,如果 Gmail 看起来,这封邮件是垃圾邮件,那么它会自动移至垃圾邮件文件夹,而普通电子邮件则位于普通文件夹中。

    还添加了新功能,如果我们收到某人的邮件,那么我们可以看到我们得到了一个聪明的回复(这是一种建议)。建议会根据电子邮件内容显示。

    c. 社交媒体:社交媒体中的一项具有挑战性的任务是删除成人内容。就像我们创建了一些社交媒体应用程序,数百万人在其中上传了大量内容,以及我们如何从这些内容中过滤成人内容,或者一些用户正在传播负面或仇恨言论,因此将予以解决。我们可以使用 NLP 解决这些问题。

    d. 搜索引擎:我们可以以谷歌搜索引擎为例。在那里我们可以直接向谷歌搜索一些一般性的问题,即印度的首都是什么。所以谷歌将获取数据并在一行中显示答案。

    e. 聊天机器人:在当今世界,很多公司都在使用聊天机器人。因此,聊天机器人的交流就像某个人像客户主管一样坐在另一端。假设我们以 Zomato 为例,因为 Zomato 拥有数百万客户,因此他们无法容纳更多的客户主管。因此,聊天机器人有助于解决和提供初始级别的信息。

    自然语言处理主要步骤包括:

    1. 分词(只针对中文,英文等西方字母语言已经用空格做好分词了):将文章按词组分开

    2. 词法分析:对于英文,有词头、词根、词尾的拆分,名词、动词、形容词、副词、介词的定性,多种词意的选择。比如DIAMOND,有菱形、棒球场、钻石3个含义,要根据应用选择正确的意思。

    3. 语法分析:通过语法树或其他算法,分析主语、谓语、宾语、定语、状语、补语等句子元素。

    4. 语义分析:通过选择词的正确含义,在正确句法的指导下,将句子的正确含义表达出来。方法主要有语义文法、格文法。

    但是以上的分析,仅适用于小规模的实验室研究,远不能应用到实际语言环境中,比如说语法,我们能总结出的语法是有限的,可是日常应用的句子,绝大部分是不遵守语法的,如果让语法包罗所有可能的应用,会出现爆炸的景象。

    常见的 NLP 任务

    a. 文本/文档分类:文本分类是最基本的 NLP 任务之一,包括根据内容为文本分配类别(标签)。

    b. 情感分析:这是一种文本分类,其中 NLP 算法确定文本的正面、负面或中性内涵。用例包括通过分析推文、帖子、评论和其他反应来分析客户的反馈、检测趋势、进行市场研究等。情绪分析可以涵盖从 App Store 上发布新游戏到政治演讲和监管变化的所有内容。

    c. 信息检索:假设我们有一些文本,我们必须从该文本中提取名称、位置、日期、产品名称等实体。如果我们必须提取它,任何类似信息的东西都会在检索中出现。

    d. 词性标注:这是重要的文本预处理步骤之一。我们做什么,我们拥有的文本,从该文本中,我们为每个单词分配一个词性,就像它是名词或动词或形容词或副词一样。此方法用于聊天机器人,以便聊天机器人可以逐字理解每个单词。

    e. 语言检测和机器翻译:我们都知道谷歌翻译使用相同的方法。我们使用谷歌翻译,我们知道这是一个如此强大的应用程序。存在许多语言的地方。即使我们知道一种语言,我们也可以了解其他语言。我们可以将文本数据从一种语言转换为另一种语言。

    f. 对话代理:对话代理就像一个聊天机器人,但存在两种聊天机器人。一种是基于文本的,另一种是基于语音的。我们可以举一个 Siri 或 Alexa 的例子,它们都是基于语音的。如果我们谈论电报、远足,或者在 Swiggy 或 Zomato 上,他们有一个基于文本的聊天机器人。

    g. 知识图谱和 QA 系统:假设我们有大量的数据库,并且从该数据库中,我们尝试使用某种逻辑连接实体,然后我们制作一个知识图谱,然后我们可以将其转换为一个 Question-Ask 申请。

    h. 文本摘要:这基本上就像,假设我们有一篇完整的文章,我们可以从那篇文章中做一个总结。我们可以给出一个小表格。我们可以举的例子之一是 Inshorts 新闻应用程序。所以基本上这个应用程序所做的就是帮助将新闻缩短为 60 字的新闻摘要。

    i. 文本生成:我们在日常生活中都使用文本生成。即如果我们看到,在键盘中,当我们根据您之前的打字行为自动键入内容时,它会预测下一个单词,并且我们都知道在与某人聊天时使用了多少。

    j. 拼写检查和语法纠正:如果句子形成中出现拼写错误或发生某些语法错误,它会突出显示该单词,以便我们改进该单词或句子。

    k. 语音转文本:在这里,我们创建了一个像 Siri 和 Alexa 这样的会话代理。此外,此 NLP 任务用于我们所说的谷歌翻译并将其转换为文本。这也有助于我们用一种语言说话并且我们可以转换成另一种语言。例如,不同国家的人们试图交流,但他们不理解彼此的语言。所以谷歌翻译帮助他们理解彼此的语言并进行交流。

    总之,目前ChatGPT的爆火,使得国内各大厂商开始布局人工智能模型的具体应用落地,一切技术都是为了提高人类生产生活而不断的进步,学习永无止境,愿你我共同进步,不被时代的潮流所遗弃。

    相关文章

      网友评论

        本文标题:自然语言处理(NLP)的初步理解

        本文链接:https://www.haomeiwen.com/subject/uyufadtx.html