Linux助力收割玉米(域名)

对于个人博客来说,如此标题乃SEO之大忌
本文讲的是如何利用linux下的流处理工具帮助我们拣出好域名。

首先去搜狗下载你想要注册域名类型的拼音词库,这里我下载了三字成语,词库不能用文本工具直接打开,得转换一下。转换工具下载地址下载Release_V2.2.1.zip接下来是这个工具的体检报告http://r.virscan.org/report/f9bf5b07ad569a93b7f9521a388706a7

首先在记事本里面用替换功能把所有的上置逗号替换成空。

此时字典的样子:

[root@hqidicom ]#tail zuichu
zouzheqiao 走着瞧
zushengbian 祖生鞭
zuankongzi 钻空子
zuidaoer 嘴道儿
zuiludou 嘴卢都
zuoshangbin 座上宾
zuoshangke 座上客
zuoyouming 座右铭
zuoyoushou 左右手
zuoyoutan 左右袒

把汉字去掉,只保留前面的拼音:

[root@hqidicom ]#awk '{print $1}' zuichu >zidian0
[root@hqidicom ]#tail !$
tail zidian0
zouzheqiao
zushengbian
zuankongzi
zuidaoer
zuiludou
zuoshangbin
zuoshangke
zuoyouming
zuoyoushou
zuoyoutan

此时,字典就能用了,这里我们用倾诉大神提供的扫米工具来扫一扫。

[root@hqidicom ]#./DomainMegaBot 
THANK YOU FOR USING DOMAINMEGABOT POWERED BY HAR-KUUN (HTTPS://QING.SU). 

PLEASE NOTE THAT THIS BOT DOES NOT GUARANTEE THE AVAILABILITY. REGISTRAR'S RULES APPLY.

PLEASE SPECIFY TLD: com
PLEASE SPECIFY DICTIONARY FILE: zidian0
aduwu.com NOT AVAILABLE.
anlewo.com NOT AVAILABLE.
aoshuangzhi.com NOT AVAILABLE.
babuai.com NOT AVAILABLE.
badoucai.com NOT AVAILABLE.
balongxun.com AVAILABLE FOR REGISTRATION!
baxiali.com NOT AVAILABLE.

扫描结束后,当前目录下会生成一个com_RESULTS.DAT文件,里面是可注册域名。我们把可注册域名写入文件 kezhuce
grep com com_RESULTS.DAT >kezhuce
现在字典是这个样子的:

[root@hqidicom ]#tail kezhuce
zhengqiushou.com
zhichiyan.com
zhuzuiguan.com
zhuanpengshen.com
zhuanwanzi.com
zhuangxiyin.com
zhuangyangsuan.com
zushengbian.com
zuidaoer.com
zuiludou.com

我们知道这些域名是可以注册的,但很不直观,我想要每个域名后带上汉字,就像最初的那个样子

[root@hqidicom ]#tail zuichu
zouzheqiao 走着瞧
zushengbian 祖生鞭
zuankongzi 钻空子
zuidaoer 嘴道儿
zuiludou 嘴卢都
zuoshangbin 座上宾
zuoshangke 座上客
zuoyouming 座右铭
zuoyoushou 左右手
zuoyoutan 左右袒

先把末尾的.com删掉:

[root@hqidicom ]#awk -F. '{print $1}' kezhuce >kezhuceV1
[root@hqidicom ]#tail !$
tail kezhuceV1
zhengqiushou
zhichiyan
zhuzuiguan
zhuanpengshen
zhuanwanzi
zhuangxiyin
zhuangyangsuan
zushengbian
zuidaoer
zuiludou

此时,我们就是要把zuichu文件里面不可注册的域名所在的行删除,剩下的就是可注册域名。
现在的情况是,文件kezhuceV1里面只有可注册的域名,文件zuichu里面有可注册的,也有不可注册的,对比两个文件的第一列,若同一个值出现两次(比方说zuiludou在两个文件里都有出现,则把对应的“嘴卢都”输出),总之效果如下:

[root@hqidicom ]#awk 'NR==FNR{a[$1]++}NR>FNR && a[$1]==1' kezhuceV1 zuichu |head
balongxun 八龙荀
baimasheng 白马生
beiqunkong 北群空
bianluma 变鹿马
buziliang 不自量
calanwu 拆烂污
changanjin 长安近
changjingyin 长鲸饮
changqingbing 长卿病
chihudan 吃虎胆

若看不懂这条awk,下面一条可能好理解一些:

[root@hqidicom ]#awk 'NR==FNR{a[$1]++}NR>FNR{if(a[$1]==1)print $0}'   kezhuceV1 zuichu |head
balongxun 八龙荀
baimasheng 白马生
beiqunkong 北群空
bianluma 变鹿马
buziliang 不自量
calanwu 拆烂污
changanjin 长安近
changjingyin 长鲸饮
changqingbing 长卿病
chihudan 吃虎胆

若还是看不懂,那看看这条能不能看懂:

[root@hqidicom ]#awk 'NR==FNR{a[$1]++;next}{if(a[$1]==1){print $0}}' kezhuceV1 zuichu |head
balongxun 八龙荀
baimasheng 白马生
beiqunkong 北群空
bianluma 变鹿马
buziliang 不自量
calanwu 拆烂污
changanjin 长安近
changjingyin 长鲸饮
changqingbing 长卿病
chihudan 吃虎胆

非IT人士就别研究这个awk语句了,用的时候依葫芦画瓢就行。
得到了直观的可注册域名还不够,域名是越短越好的,所以我们来排个序。

awk 'NR==FNR{a[$1]++;next}{if(a[$1]==1){print $0}}' kezhuceV1 zuichu |awk '{print length,$0}' |sort -n |awk '{print $2,$3}' |tail
zhengqiushou 正丘首
changqingbing 长卿病
qingchangying 请长缨
shuizhonglong 水中龙
washangshuang 瓦上霜
zengshengchen 甑生尘
zhuanpengshen 转蓬身
shangshuichuan 上水船
shanzhongxiang 山中相
zhuangyangsuan 装洋蒜

若觉得本文对你有帮助,打赏杯卡布奇诺板蓝根呗,说不定你按本文的方法买到类似jingongmen.com的域名呢。

原创文章,转载请注明: 转载自笛声

本文链接地址: Linux助力收割玉米(域名)

7 条评论

  • 龙笑天 2017年11月29日 回复

    你这linux玩的很6啊~

  • 姜辰 2017年11月29日 回复

    linux大佬~

  • 懿古今 2017年11月29日 回复

    好域名早就被抢光了,所以我们个人站长用着自己觉得好的域名就行了

  • 历史笔记 2017年11月30日 回复

    好像很牛逼的样子

  • mrhe 2017年12月1日 回复

    手里好多域名,再不剁手啦,等过期只留2.3个最心爱的

    • dige 2017年12月1日 回复 作者

      目前来看.com最值得保留。

  • 小萝博客 2017年12月5日 回复

    买多了砸在自己手里

发表评论

电子邮件地址不会被公开。 必填项已用*标注