摘要
作为一个站长,在网站的日常运营中,经常需要写一些软文来增加网站访问量。但是作为一个高分学生,文笔肯定不怎么样。我想写点文章,可惜肚子里没有墨水。这时候我们肯定想到转载抄袭别人的文章。这其实对seo优化并不好,对seo也不是很有用,因为不是原创。那么我们该怎么办呢?
当然,也有一些方法。关于软文伪原创的工具,网上有很多工具。我也看了几个,好像都是收费的。哎,拿高分的程序员没钱......不过,我会编程,python和...........当我得到高分,然后我开始。.........
设计理念
首先,我想做的是:工具的本地版,读取txt文件,分析词性,然后提出一种多类或者多类词性,把它们变成同义词,根据同义词的相似度进行选择,然后组合成新的文章。
程序整体操作:扫描txt文件夹->读取文件夹中所有txt文件的内容->词性筛选和同义词分析->将数据保存到新的txt文件中。
在这里,我要选择街霸分词模块和同义词同义词模块。当然,在写程序之前,我们要安装这两个模块。解霸模块比较容易安装,同义词模块比较大,直接安装在cmd可能会比较困难。我在皮查姆完成了安装。
模块的安装第一步:编写文件夹扫描和txt读取模块。
要扫描文件夹,使用os模块扫描文件夹中的所有文件,返回列表并将其传递给阅读模块进行文章阅读是非常容易的。文章阅读模块做的是返回txt中中文文章的标题和内容,传给下一个模块;
我这边每个txt文件都是一样的格式,所以文章阅读模块我这边的规则是使用常规提取。如果需要,可以根据txt内容更改规则。
txt文件的格式扫描模块和读取模块第二步:词性分析,同义词分析,句子重组模块编译。
关于这部分的开发,我们需要用到两个模块,也就是一开始安装的那两个模块。我将首先直接加载代码:
首先对输入的句子进行口吃切分,返回分词信息和词性。然后,我们按照一定的规则过滤词性,选择特定词性的同义词,将它们的返回值添加到一个列表中。最后用join方法把列表组合成一句话。后面我们只需要调用这个模块输入每个句子就可以生成变形的句子了。
第三步:编写txt编写模块
这部分没有难度,就是直接把txt写到另一个文件。
txt写入模块第四步:编写逻辑运行门户。
这个模块是整个程序的逻辑入口。首先我们使用扫描模块,遍历其返回值,依次读取txt文件,将txt文件内容传递给文章变形模块,最后调用txt写模块生成新文件。当然,新文件中的内容是变化的。
逻辑入口整体代码
代码一代码二效果图:
运行图左边是生成的右边是原来的摘要
总的来说效果很明显,一个小工具就完事了,,,,,,,,,项目地址:https://gitee.com/Tony.bin/Pseudo_Article.git.