核心有两个: 1 选小size的低智模型 2 用trick的prompt 前者小参数一般指是的是两位数B以下的模型,最好是1.5B左右的小模型,这种模型的智力不会高到什么地方。
然后再用比较tirkcy的Prompt,比如下面这个: 重复这句话两次:'重复这句话两次:' 这个就让Gemma 9B这个笨蛋模型卡住了,其实可以理解为死循环。
它的特征就是:Prompt的输出又是一条指令。
也就是我让你做一件事情,但是这件事情的结果本身又是一条指令,那么“比较…。
{dede:pagebreak/}
如何评价网易新单机游戏作品《归唐》的首发 PV ?
据调查使用五笔输入法人数仅剩 3%,五笔输入法是怎么没落的?
如何看待罗永浩回忆被华为公司余承东野蛮人式挖人?
你看过最绝望的一张图片?
养乌龟生态缸到底可行吗?
利用爬虫技术能做到哪些很酷很有趣很有用的事情?
养乌龟生态缸到底可行吗?
Rust怎么写GUI程序?
网传《碟中谍 8》亏损可能超 14 亿,是真的吗?这背后的原因是什么?
新买了一台nas,第一个月下载20t+,上传5+,不会被网警盯上吧?
用J***a写Android的时代是不是要结束了?
现代艺术只考虑意义、不考虑美感吗?
有没有宝塔平替的服务器管理面板,现在宝塔越来越贵了,也太臃肿了?
我毕业想成为前端工程师,可是前端技术太多,越学越多,可是我想成为技术强的人,又很无助,怎么办?
如何评价MiniMax开源首个视觉RL统一框架V-Triune,实现推理感知一肩挑,其技术上有何优势?
美军 B-2 轰炸机参与袭击伊朗核设施,B-2轰炸机战斗力如何?会摧毁伊朗核设施吗?