最近,媒体大量关注统计 AI 与符号 AI 的融合,以用于语言 实现混合 AI 与 理解系统。有些人称之为神经符号 AI,其中 AI 的知识基础增强了其统计基础的实用性,反之亦然。
Gartner 将这些功能称为复合 AI,即组织采用各种 AI 技术(包括统计和符号技术)来解决语言理解问题和其他问题。这种混合方法融合了 AI 的两种传统上对立的自然语言处理方法——机器学习和符号 AI 的规则和分类法——因此,一个方法的优势可以弥补另一个方法的劣势。
例如,用户可以通过使用包含概念、关系、规则和分类法的知识图谱进行训练,加速监督学习对大量训练数据的需求。无监督学习方法可以用各种概念和关系来丰富知识图谱。
实现混合人工智能的关键
目前,关于如何正确实施这种混合语言理解方法的文献很少。我发现有三种最佳实践可以实现这一目标。
第一,从最终目标开始,该目标基于期望结果、可用数 whatsapp 号码数据 据和预算。第二,通过在此过程中尽早并经常让主题专家参与进来,让专家参与其中。第三,让业务问题的复杂性决定统计和符号方法的比例。
遵循这些最佳实践将允许组织通过结合符号 AI 和机器学习技术来优化他们的语言理解应用程序。
协调数据、结果和预算
实施混合语言理解方法的第一步是确定期望结果、可用数据和可用预算。最好不要先入为主,并根据这三个因素保持开放的心态。
可用的数据有两种类型:机器学习的训练数据和符号 AI 的企业知识。前者涉及机器学习模型将预测的结果示例。这些结果需要对监督学习部署进行注释。企业知识包括业务规则、分类法、词汇表、本体和业务词汇表等内容。
混合语言理解系统的结果通常分为三类。
- 认知过程自动化 (CPA) 可能涉及从任何类型的文档中提取非结构化数据以供下游系统使用。
- 例如,文本分析可以帮助财务分析师在新闻 如何使用信息图表实现你的内容营销目标 报道中识别市场趋势。
- 例如,对话式人工智能对于支持客户服务的智能聊天机器人很有用。
您的预算分配对于实施的实用性至关重要。预算较少时,需要使用简单的机器学习方法,而这些方法只能对现有的语言理解系统产生渐进式的改进。
让专家了解情况
任何语言理解应用的成功都离不开领域专家的投入。这些专家对使用语言理解系统的特定业务领域知识渊博,无需精通人工智能技术。
这些专家通过多种方式为这些工作提供了宝贵的帮助。他们知道统计和符号方法有哪些资源和数据可用。通常,他们熟悉应用程序所针对的业务用例。因此,他们知道在哪里可以找到示例数据或企业知识,以及其中哪些方面与实现业务目标最相关。
此外,他们的专业知识对于真正结合符号 AI 和机器 澳大利亚电话号码 学习至关重要。例如,在构建监督学习模型时,用户必须注释用于训练的示例数据。专家可以指出哪些数据可用以及标记可能需要多长时间,这可能需要相当长的时间。但是,通过协助编写符号 AI 规则,专家可以将训练时间缩短到更少的天数,同时监督此过程并批准规则。
虽然数据科学家可能是设计这些系统的人,但学科专家负责监督塑造这些系统的内容过程。