当前位置: 羁绊动漫漫慢说

Doge表情包原型去世,GPT-4o中文训练被色情污染?

2024-05-27 14:15

著名表情包doge的原型柴犬去世

据BNO报道,著名表情包doge的原型柴犬卡波苏于5月24日(Kabosu)去世。

18岁的柴犬卡波苏此前被诊断出患有白血病和肝病,该柴犬是网络流行表情包“Doge”的原型。

根据主人佐藤在博客上分享的近况更新,著名表情包doge的原型柴犬Kabosu 于24日上午去世。

Kabosu 的主人发文表示:“致长期喜爱 Kabosu 的人们,真的非常感谢。我认为 Kabosu 是世界上最幸福的狗狗,而我是最幸福的主人。”

虽然大多数人或多或少都用过doge表情包,但我想大多数人对于它的原型柴犬Kabosu或许并不够了解。

柴犬Kabosu,于2006年11月2日出生。曾被原主人弃养,还差点遭到安乐死。

008年11月被现主人——日本一位幼儿园的老师Atsuko Sato收养,生活才有了转变。

家中除了它以外,还有主人后来收养的另外两只叫银杏和杜鹃的猫咪陪伴,主人还特地为它们开了博客,记录它们的日常生活。

而doge的爆火还要从2010年说起。2010年2月13日,doge的主人在博客上发布了Kabosu的一系列照片。

其中一张照片中,柴犬倚靠在沙发上,前爪相叠,侧身瞪眼竖起眉毛,传神的表情令人忍俊不禁。

照片迅速在美国的Reddit(美国最大的网上社区)和Tumblr(轻博客)等网络圈走红,最终出现在“柴犬的自白”(ShibaConfessions)博客中。

而同样作为狗狗表情包,doge和cheems也有着特殊的缘分,不过cheems的原型Balltze已经在23年的一场手术中去世,真是让人感慨世事无常啊。

希望Kabosu和Balltze这对可爱的狗狗们可以在狗星再续前缘吧!一路走好!Kabosu!

 

GPT-4o的中文训练数据被色情网站和赌博垃圾邮件污染

众所周知啊,由OpenAI研发的ChatGPT可谓是新时代的顶流AI了。

就在OpenAI对GPT-40的中文模块研发后不久,一些会说中文的人开始注意到,这个最新版本的聊天机器人似乎有些不对劲?

5月14日,普林斯顿大学研究大型语言模型推理效率的博士生蔡天乐访问了GPT-40的公共标记库,并调出了该模型用于解析和压缩中文提示的100个最长中文标记的列表。

随后他惊讶的发现,这个语言模型用来解析文本的标记充满了垃坡信息和色情短语。

在100项结果中只有3项是日常对话中常用的,其他都是些赌博或色情的词汇。

最长的词元有10.5个汉字,字面意思是"免费观看日本色情视频"....他写道:"这有点荒唐,"随后便在GitHub上发布了词元列表。

在中文方面,GPT-4o使用的新标记器引入了过多的无意义短语。专家表示,这很可能是由于在训练标记器之前,数据清理和过滤工作做得不够。

有网友表示,这可能和中文互联网特有的生态有关。国内有用的数据基本全是闭源,大厂的app都想做万能社区,各种圈地合并。

现在国内有用的,可以收集到的用户数据,几乎只剩下贴吧知乎csdn了,网络社区全部APP化,pc端各种阉割,不少社区甚至只允许app访问。

这可能就是导致GPT-4o在中文互联网无法获得有效数据的原因,不过我遍观网友发言,发现网友对于这件事情的态度其实褒贬不一。

有的网友认为这是国内互联网生态凋敝的体现,也有的网友认为这是信息安全的体现,那么各位小伙伴是怎么看的呢?在评论区留下留言讨论吧!

借对象钱然后在520被拉黑了

最后再让我们看一位悲催老哥。

这位名叫暗影猩猩的B站网友所发动态的聊天记录显示,他和他的女朋友谈了3个多月。

最开始是在游乐园搭讪认识的,因为连续好几次在不同的位置巧遇所以主动要了微信。

两人认识的前一个月经常出去玩,但后面因为开学导致见面变少。其实两人没啥共同兴趣爱好,在网上基本只能聊聊日常和分享点短视频。(暗影猩猩:她基本没看😭)

女朋友经常说爹妈管的多严,今年进入社会工作了手机晚上还要上交亲爹,不听话手机被砸还要挨打,到最近好几天毫无动静也成为常态。

而就在这种背景下,这位老哥在5月6日的时候借了女朋友300块,之前女朋友还借了100没还。

其实这位老哥也清楚这段恋爱可能不会谈太久,但没想到会是以女友借钱后删好友这样的方式结束,这下这位老哥成小丑了,各位网友笑了再走吧。
(ps:这位老哥已经把头像换成下面这个图片了,望周知)


 

 

友情链接: