大家好,我是任康,参与了5月大航海-海外工具方向。生财续费2年了,这是第二次参加大航海,上次航海算是打酱油,只是浅浅的了解,没有深入去做什么。这次参与,搞了个小高潮,启航当天就发布了一个小工具,希望能帮助群里的同路人快速认识、建立深度的连接可能性。
先来看看战绩:
- 2天时间110名同路人尝试使用,群里的渗透率21%,大家尝试了168条对话
- 我这里消耗了1美金的Tokens,成本0元(还在用OpenAI api赠送的5美金credit)
下面我们就进入这次的小小复盘:
- 需求挖掘
从自己的需求出发,不论是在大航海的群里,还是其他资源对接群,经常会出现大家发个人介绍,看不过来,也比较难做及时的深入沟通对接;
我就在想,是不是能用ChatGPT做点新东西,把大家的个人介绍投喂进去,以后就可以随时查找需要建联的人
- 解决方案设计
有了这个需求,如何低成本快速的解决,是第二步关键动作。很多时候想的太复杂、成本太高、实现周期太长,大家都会失去动力和持续维护的心态。
最近在B站很火的视频,就是各种介绍ChatGLM+Langchain实现个人知识库,一直没有时间去学习。正好前两天了解到一个开源的项目Dify.ai,可以一键搭建一个私有数据的chatbot,正好用这个需求来练手。
- 实现过程
1、官网在这里https://dify.ai/,使用Github或者Google账号可以直接注册登录;
2、创建应用,这里我们选择「对话型应用」
3、这里你的应用就创建好了,现在需要去创建数据集
4、目前支持导入文件的方式,可以是txt、HTML、Markdown、PDF,以后还会支持Notion
5、回到应用里,在提示词编排-「上下文」选择你的数据集设置开场白
6、最后,在设置-模型供应商,添加你的OpenAI的key,平台会送你200次调用做测试。然后去发布你的应用吧。
- 几个干货分享
1、如何快速把个人信息导入数据集?
微信里多选聊天记录-收藏-收藏转日记,全选拷贝到notion,export导出为.md,就可以导入到Dify.ai里了
2、如何优化数据集质量?
这里引用官方回复我的方法:
每个分段尽可能保持整段语意的完整。若自动分段无法满足切分预期,可尝试自定义模式,自行在文件中插入分隔符,如:"----",以达到按自己的分段规则切分。针对用户问题进行预测,并收集用户经常提问的问题,配合命中测试,观察命中率,以及问题与实际数据集匹配程度,如果效果不理想,建议针对数据集内容进行优化。举个例子:用户提问:公司创立时间是什么时候预期匹配数据集内容:……XXX 公司(2020-2023)由于 (2020-2023)与创立时间语意相差较大,因此,最终获取到的分段大概率不符合预期,因此建议将 (2020-2023) 改为:XXX 公司成立时间:2020年XX月XX日。暂时列举 2 个目前效果较为明显的优化方法。
3、如何自定义域名?
官方支持后端即服务的发布方式,可以一键发布到Vercel;
域名通过Cloudflare托管,就可以在vercel自定义域名了。
比如我这个https://navchat.rkkc.shop/
(大家感兴趣,我再专门写一篇托管和自定义域名)
最后说说收获和后续计划
- 边学习边动手,立马行动,是最重要的
- 这个项目,还可以有很多其他场景供大家发掘,群里已经有朋友在聊,法律咨询AI、宝宝取名AI等等
- 本周抽时间,继续优化数据集的格式,提高准确率,为其他项目做准备
体验地址:
https://udify.app/chat/bYAIDSNCb8K3ZVUW
#航海实战 #ChatGPT #Dify.ai
Comments on "《还没启航就交卷的这件小事》" :