用Python弄点有趣的东西玩玩,抓抓小姐姐,写写工具脚本, 抓点有用数据,做下数据分析,后面会学学写后台~
一开始因为没有统一输入输出限定,项目结构,项目乱糟糟的, 2018.3.22 花了一下午整理了一下结构:
├── build(执行相关目录)
│ └── outputs (生成文件目录)
│ ├── documents (生成文档目录)
│ ├── logs (生成日志目录,中途过渡用)
│ ├── pictures (生成图片目录)
│ └── videos (生成非图片类资源目录)
├── code (代码存放目录)
│ ├── analysis (数据分析类)
│ │ ├── CatchWorkingReport.py (抓取2018年政府报告高频词做词云)
│ │ ├── LGDataAnalysis.py (拉取拉勾网2018年Android岗位相关做数据分析)
│ │ ├── WZLYAnalysis.py (Jupyter Notebook分析我主良缘妹子交友信息)
│ │ └── WZLY.ipynb (抓取我主良缘妹子交友数据,并做数据分析)
│ ├── meizi (图片抓取类)
│ │ ├── CatchAiTaoTuPic.py (抓取爱套图网妹子图)
│ │ ├── CatchBcyCosPic.py (抓取半次元Cos图)
│ │ ├── CatchHuaBanPic.py (抓取花瓣网妹子图)
│ │ ├── CatchJianDanMeiziPic.py (抓取煎蛋网妹子图)
│ │ ├── CatchMWeiboPic.py (抓取某个微博里的所有图)
│ │ ├── CatchTieBaPic.py (抓取某个贴吧链接里的所有图片)
│ │ ├── CatchTuChongPic.py (抓取图虫妹子图)
│ │ ├── FuliShePicCatch.py (抓取福利社妹子图)
│ │ ├── GankPicCatch.py (抓取GankIO妹子图)
│ │ └── win400MeituCatch.py (抓取win400妹子图)
│ ├── threading (多线程相关)
│ │ ├── BarrierTest.py (栅栏Barrier使用示例)
│ │ ├── ConditionTest.py (Condition条件变量使用示例,实现简单的生产者与消费者)
│ │ ├── EventTest.py (通用的条件变量Event 使用示例)
│ │ ├── lockTest.py (Lock指令锁的使用示例)
│ │ ├── queueTest.py (队列queue使用示例)
│ │ ├── SemaphoreTest.py (信号量Semaphore的使用示例)
│ │ ├── threadlocalTest.py (线程局部变量使用示例)
│ │ └── TimerTest.py (定时器Timer使用示例)
│ └── tools (工具类)
│ ├── CatchCityCode.py (抓取城市编码)
│ ├── CatchDoubanMusic250.py (抓取豆瓣音乐250写入Excel)
│ ├── CatchIdCardAreaCodeN.py (抓取身份证前6位地区码,新)
│ ├── CatchIdCardAreaCode.py (抓取身份证前6位地区码,旧)
│ ├── CatchPostCode.py (抓取邮政编码)
│ ├── CatchWeChatRes.py (抓取某篇微信文章里所有的图片,语音,视频)
│ ├── CatchXiCiProxyIPs.py (抓取西刺代理中速度较快的代理ip)
│ ├── CsdnLogin.py (CSDN模拟登录)
│ └── CsdnReaderHelper.py (刷CSDN博客访问量脚本)
│ └── WechatXYZHelper.py (基于itchat的机器人,小宇宙新闻群发,自动通过好友申请,自动回复)
├── coderpig_n.py (自己写简易工具模块,版本2)
├── coderpig.py (自己写简易工具模块,版本1)
├── config.py (配置文件,目前主要用于指定输出路径)
├── LICENSE (授权文件)
├── proxy_ip.txt (代理ip列表文件)
├── README.md
├── res (代码运行所需的资源,比如字体,图片等等)
│ ├── documents
│ └── pictures
└── tools.py (自己写简易工具模块,版本3)
不定期更新脚本,脚本失效了,或者你有想抓的网站,想做的小工具, 欢迎提issues,可以加下我微信,拉你进群一起学习Py!
我写过的Python教程可见:https://juejin.im/user/570afb741ea493005de84da3