AI学院

  • 斯坦福知识图谱课程|L8.1自监督实体识别与消歧

    自监督实体识别与消歧:关于知识工艺研讨会第4周内容的视频。今天的讲座主要关注从结构化数据中创建知识图谱的过程中出现的问题,包括模式映射、记录链接和数据清理。演讲者Lauren Orr将分享自监督实体消歧的知识,以减少人力投入。Mayan Kejriwal将介绍Web规模知识中的实体解析,并展示知识图谱的大图景以及其中的步骤。 罕见实体挑战与尾部实体高性能:讲…

    2024年4月16日
    00381
  • 斯坦福知识图谱课程|L7如何从结构化数据中构建知识图谱

    结构化数据创建知识图:讲述了如何从结构化数据创建知识图。首先介绍了模式映射和记录链接两个问题,其中模式映射需要解决不同系统之间模式难以理解和映射不一对一的问题。然后讲解了如何从结构化数据中提取知识,以及如何整合外部数据与内部数据。最后以金融机构的客户视图为例,说明了创建知识图的重要性和挑战。 自动化模式映射问题:讨论了自动化模式映射的问题。虽然有人声称应该通…

    2024年4月16日
    00424
  • 斯坦福知识图谱课程|L6.3维基数据中的实体schema和形状语言

    维基数据的实体模式和形状语言:介绍了维基数据中使用实体模式和运输快递的原因。实体模式和形状表达式可以帮助生产者描述和验证他们要生产的内容,也可以让消费者更好地理解知识图谱的内容并验证数据的准确性。此外,形状表达式还可以生成查询和优化数据。形状表达式被创建出来的目标之一就是让人能够读懂它。 形状表达式的目标受众和语法:介绍了形状表达式的目标受众和语法的灵感来源…

    2024年4月16日
    00415
  • 斯坦福知识图谱课程|L6.2给维基数据添加Convid信息

    演示维基数据添加信息:关于一个演示的进行,演示的内容是关于如何将信息添加到维基数据中,并讨论了如何对齐资源。演示者感谢了给予的机会,并介绍了他们的工作。演示中还提到了一个最近发表的论文,探讨了一个用于对齐资源的协议或步骤。这个协议可以应用于处理人类冠状病毒相关的信息。演示者还展示了一些论文数量的例子。 疾病爆发和科学研究:讨论了关于疾病爆发和科学研究的图表。…

    2024年4月16日
    00512
  • 斯坦福知识图谱课程|L6.1把维基百科数据构建成维基数据库

    知识图谱的模式设计:介绍了知识图谱的模式设计。第一个演讲者Peter Patel Schneider介绍了本体语言OWL,并探讨了知识图谱如何从数据中获取知识。第二个演讲者Andhra Bhagmister和Jose介绍了如何使用贪婪信息扩展Wikidata的模式。他们强调了知识图谱中的知识不仅仅是数据,还有其他重要的内容。Wikidata是一个由社区驱动的…

    2024年4月15日
    00415
  • 斯坦福知识图谱课程|L5如何设计知识图谱schema

    知识图谱设计原则:如何创建知识图谱的设计原则。知识图谱创建有两个主要步骤,第一是设计一个模式,然后用一组实例填充该模式。在设计模式时,需要遵循一些原则,如使用IRI命名事物、使用标准RDF提供有用的信息,并在数据集中包含链接等。这些原则帮助创建一个有意义且易于理解的知识图谱。 虹膜的使用和引用:讨论了在数据集中对虹膜的使用和引用。虹膜是用来唯一引用对象的方式…

    2024年4月15日
    00501
  • 斯坦福知识图谱课程|L4.2分布式RDF数据管理与查询

    分布式RDF数据管理与查询:介绍了分布式RDF和Sparkly的应用以及管理RDF数据的挑战。作者提到了RDF的常见用例、数据集的增长以及数据管理的需求。他还介绍了基于规模的解决方案和联合解决方案,并解释了它们的应用场景。最后,他提到了一次会议中有关知识图谱和方法的演讲。 知识图谱和方法:关于知识图谱和方法的主题演讲。演讲者对系统进行了分类,包括集中式、客户…

    2024年4月15日
    00532
  • 斯坦福知识图谱课程|L4应用Cypher进行图谱查询

    概述知识图和数据模型:识工艺研讨会的一部分,重点是知识图和数据模型。两位专家将介绍属性图和RDF数据模型,以及密码查询语言。他们还将讨论开放循环项目和图查询语言的标准化工作。这些演讲将提供大约30分钟的技术概述,并留出时间进行深入的问题讨论。 属性图数据模型构造:介绍了属性图数据模型的构造和节点、边的属性。属性图数据模型由节点和边构成,节点可以有零个或多个标…

    2024年4月15日
    00704
  • 斯坦福知识图谱课程|L3图数据模型

    知识图数据模型简介:介绍了知识图数据模型的两种流行形式:资源描述框架(RDF)和属性图。RDF使用Sparkle查询语言,而属性图使用Cipher查询语言。讲座的目标是提供对这两种数据模型的概述和比较,以及它们与传统关系数据模型的关系。此外,还讨论了这些数据模型的限制和图数据模型的定义。最后,介绍了国际化资源标识符(IRI)以及IRI与统一资源标识符(URL…

    2024年4月15日
    00596
  • 斯坦福知识图谱课程|L2知识图谱的What和Why

    知识图谱的概念和重要性:介绍了知识图谱的概念和重要性。知识图谱是一种用于管理和处理大数据的模型,可以将不同的对象和关系以图形方式连接起来。从最早的实体关系模型到现在的面向对象模型,知识图谱的发展越来越丰富。随着大数据时代的来临,我们需要更强大的模型来处理和分析海量的数据。知识图谱为我们提供了一种有效的方式来组织和理解复杂的信息网络。 非结构化数据和深层网络:…

    2024年4月15日
    00515
  • 斯坦福知识图谱课程|L1知识图谱简介

    节点和边的定义:讲述了在数据模型中定义节点和边的不同方式。有向标签图被用作核心数学表示,不同数据模型可能使用不同的术语来指代节点和边。在讲座中举了几个例子,包括友谊关系和子类关系的图示。节点和边的含义可以通过文本文档、逻辑规范或例子来定义。此外,还提到了使用嵌入来捕获含义的统计方法。总的来说,捕捉含义是计算机科学中许多领域问题的核心。 捕捉意义的方法:讲述了…

    2024年4月15日
    00388
  • 吴恩达机器学习专项课程 | 多项式回归

    吴恩达机器学习专项课程主要介绍了多项式回归的概念,并通过具体示例展示了如何通过特征工程和多项式函数来更好地拟合非线性数据。文章首先解释了多项式回归的原理,即通过引入原始特征的高次幂作为新特征,使得模型能够拟合曲线和非线性函数。接着,文章通过房屋数据集的例子,详细说明了如何使用平方和立方等特征来进行多项式回归,并指出了特征缩放在处理不同值范围特征时的重要性。此…

    2024年4月12日
    0066
  • 吴恩达机器学习专项课程 | 特征工程

    吴恩达机器学习专项课程主要探讨了特征选择对于学习算法性能的重要性,并以预测房屋价格的示例为基础,详细说明了如何通过特征工程来设计更合适的特征,从而提升学习算法的预测准确性。文章首先强调了正确选择或设计特征对于算法良好运行的关键性,并引出了特征工程的概念。接着,通过具体的示例,解释了如何通过组合原始特征来创建新的特征,以便学习算法更容易做出准确的预测。文章最后…

    2024年4月12日
    00125
  • 吴恩达机器学习专项课程 | 如何设置学习率

    吴恩达机器学习专项课程主要讨论了学习率的选择对于机器学习算法的重要性。如果学习率太小,算法运行缓慢;如果学习率太大,算法可能无法收敛。文章详细解释了如何通过观察成本函数的迭代变化来判断学习率是否适当,并提供了解决成本上升问题的建议,即减小学习率。此外,文章还强调了正确实施梯度下降的重要性,并给出了一个调试技巧:使用非常小的学习率来观察成本函数是否减少,以此判…

    2024年4月12日
    0076
  • 吴恩达机器学习专项课程 | 判断梯度下降是否收敛

    吴恩达机器学习专项课程主要讨论了如何为机器学习模型选择一个合适的学习率。学习率是梯度下降算法中的一个关键参数,它决定了模型在每次迭代中参数更新的步长。适当的学习率可以使得算法更快地收敛到最优解,而过大或过小的学习率都可能导致算法性能不佳或无法收敛。文章详细解释了学习率过大时可能出现的问题,并给出了通过减小学习率来解决这一问题的建议。此外,文章还强调了正确实施…

    2024年4月12日
    0088
关注微信
Sora改变AI认知方式,开启走向「世界模拟器」的史诗级的漫漫征途。