今天不讲硬核的东西,讲一个好玩的东西。
背景故事:
之前参加mini航海(生财有术社群活动)的时候,我加入了一个接单群,然后这个群平时会有一些消息,我很讨厌手机一直滴滴个不停,所以把所有的群都屏蔽了,但是这也导致我无法及时看到群里的接龙消息,错过抢单的最佳时机。
解决思路:
我最开始的方案是让自己的微信号登录微信网页版,这样就可以通过nodejs(一种编程语言,js它爹),去劫持群消息,然后检测到 【接龙】关键字就发出警报,因为我很久之前就成功实现了这样的功能,当时甚至可以直接把群消息自动保存到飞书,然后还给我的微信接入了GPT,也是初生牛犊不怕虎,后面我才知道这个东西有封号风险,我就火速停止使用了。
最终方案:
昨天晚上,我睡不着又开始琢磨这个事情,我想是不是可以模拟人去监控屏幕,出现接龙这个字,我就让它发出警报,而强大的python恰恰有orc识别的插件,说干就干,我就把我的需求写了一份文档,发给了cursor,吭哧吭哧就出了一份代码,我一跑,报错.... 然后就一直debug,大概改了五六次,这个软件终于完美成型。
软件展示:

这个使用也特别简单,点击选择监听区域,可以像微信截图一样选一个矩形区域,它就会实时检测这个区域的像素变化,如果发生改变,就行调用orc识别,把识别图像的文字提取出来放到数组里。
然后可以写要监听的关键词,如果orc识别到指定监听的关键词,就会发出警报的声音并且弹窗提示。
然后为了调试我设置了监听的间隔时间,可以调任意几秒监听一次。
比如群消息是这样:

那它的监听结果就是:

为了更好的阅读体验,来飞书看吧:
https://a0u2vshvubw.feishu.cn/wiki/GNCPwCUmEiUVNckZ9kXcI5zhn9f
Comments on "0基础手搓AI屏幕监控警报" :