一、垃圾文字生成器介绍 最近在浏览GitHub的时候,发现了这样一个骨骼清奇的雷人项目,而且热度还特别高。 项目中文名:狗屁不通文章生成器 项目英文名:BullshitGenerator 根据作者的介绍,他是偶尔需要一些中文文字用于GUI开发时测试文本渲染,因此开发了这个废话生成器。但由于生成的废话实在是太过富于哲理,所以最近已经被小伙伴们给玩坏了。他的文风可能是这样的:你发现,引经据典,头头是道,说好的狗屁不通在哪里呢? 还有这样的:而且,同一个主题,每次点击生成,都会出现完全不同的文字。 二、垃圾文字生成器的来历 垃圾文字生成器的来历也很有意思,据作者说,最开始源于他在逛知乎的时候,发现有网友在退出学生会的时候,需要写6000字的退会申请。因为作者以前挺擅长写这类“狗屁不通”的文章。结果写了几句,突然想到还是写个程序生成吧。于是,狗屁不通文字生成器就诞生了。目前,由于项目过于火爆,有一位同学,把生成器移植到了telegram上,获得了一只充满哲思的机器人。 当被问及“今天中午吃什么”这样一个世纪难题的时候,机器人回复了整整两屏幕信息:也有一些同学,则致力于把这个项目推向国际。于是,英文版和日本版就诞生了。还有些同学,开发出了手写体版本: 三、狗屁不通文章生成器是怎么实现的? 简单翻了一下源码,真的是特别简单,一点简单的废话语料库,一点字符串拼接语句就生成了华丽丽的几千字,我们来欣赏一下源码:名人名言废话语料库,167行代码,这个只要添加更多的废话,就能生成更丰富的内容: js版本生成算法: function 生成文章() { 主题 = $('input').value let 文章 = [] for(let 空 in 主题){ let 章节 = ""; let 章节长度 = 0; while( 章节长度 < 6000 ){ let 随机数 = 随便取一个数(); if(随机数 < 5 && 章节.length > 200){ 章节 = 增加段落(章节); 文章.push(章节); 章节 = ""; } else if(随机数 < 20){ let 句子 = 来点名人名言(); 章节长度 = 章节长度 + 句子.length; 章节 = 章节 + 句子; } else{ let 句子 = 来点论述(); 章节长度 = 章节长度 + 句子.length; 章节 = 章节 + 句子; } } 章节 = 增加段落(章节); 文章.push(章节); } let 排版 = "<div>" + 文章.join("</div><div>") + "</div>"; $("#论文").innerHTML = 排版; } py版本: if __name__ == "__main__": xx = input("请输入文章主题:") for x in xx: tmp = str() while ( len(tmp) < 6000 ) : 分支 = random.randint(0,100) if 分支 < 5: tmp += 另起一段() elif 分支 < 20 : tmp += 来点名人名言() else: tmp += next(下一句废话) tmp = tmp.replace("x",xx) print(tmp) 可以看出,没有用任何高级技术,不取巧,作者声明如下:鄙人才疏学浅并不会任何自然语言处理相关算法. 而且目前比较偏爱简单有效的方式达到目的方式. 除非撞到了天花板, 否则暂时不会引入任何神经网络等算法. 不过欢迎任何人另开分支实现更复杂, 效果更好的算法. 不过除非效果拔群, 否则鄙人暂时不会融合. 这个文字细细读起来,还是挺有哲理的。额,其实就是一本正经地说废话的那种感觉。你懂的。。。 四、最后,放上链接 狗屁不通文章生成器:https://github.com/menzi11/BullshitGenerator 网页版:https://suulnnka.github.io/BullshitGenerator/index.html
|