Dify 1.1.0 是继1.0版本发布以来的第一个重大更新版本,除了日常的bug修复和功能迭代之外,还增加了一个重磅功能:元数据过滤。

由于1.1.0版本出来的时候,测试元数据过滤功能发现还有些问题,直到这次1.1.2版本出来后,测试发现没问题了。
今天就带大家认识一下:什么是元数据?什么是元数据过滤?以及元数据过滤功能实操教程!
一、什么是元数据?
一)学术性定义:
元数据(Metadata),简单来说,就是“关于数据的数据”。它用于描述数据的属性和特征,帮助我们更好地理解和管理数据。
二)大众化解释:
在日常生活中,元数据无处不在,只是我们可能没有意识到它的专业名称。
通俗来说,可以将 “元数据” 理解为你为知识库文档设置的一个个属性,比如:隐私级别,作者,分类等等。一个文档可以有多个属性。其实元数据在我们生活中处处存在,知识大家不知道他的专业名称而已。
我们通过图片来理解,可能大家就理解了:

元数据是用来描述一个实体的基本属性信息的,在操作系统内,所有文件几乎都有一些固定的字段信息:类型,作者,大小,修改信息
我们回到Dify系统内,每个知识库文档,Dify都为其内置好了一些固定的元数据,这些元数据我们是不能手动改修改的,由系统自动生成,叫做:内置元数据
dify还为我们增加了一个入口来由我们自定义设置一些文档元数据,我们叫做:自定义元数据。
自定义元数据自由定义,修改,删除。

二、什么是元数据过滤?
元数据过滤,就是查询时,系统会先基于这些文档的元数据进行第一步过滤,这个筛选是文档级别的,不需要深入文档内部,所以效率极高。
如果筛选出对应的文档,才会继续进入文档去查找匹配的数据。
如果元数据匹配未成功,系统就不会再深入文档去查询了,节省了不必要的查询。
官方给出的一张图片很形象,大家可以看下:

为了更好的阅读体验,来飞书看吧:
https://i3k3w6il9z.feishu.cn/docx/R180d5brgopaFfxYOhcc4IeDnIc
Comments on "Dify 1.1.0 元数据过滤保姆级教程:概念全方位解读与实战应用" :