技能领域
项目描述
一、项目简介
根据用户提供的微信公众号列表, 自动爬取历史文章并生成独立的静态 html 文件。
二、需求描述
原型
暂无
UI设计
无 UI 设计要求
功能需求
输入
程序需要提供一个简单的界面管理:
- 输入需要爬取的公众号账号(上千个公众号)
- 自动爬取频率(也可以人工触发爬取)
输出
跟进设置的爬取频率自动获取对应公众号下的新文章。每篇文章将是一个独立的静态 html 文件(包括文章发布时间,阅读量,标题, 原文地址)
- 获取到的文章将按照日期放在对应的目录(每天一个新目录保存当日文章和图片)
- 每次爬取将更新已获取文章的阅读量
其它要求
完成后需要将程序部署在我们使用阿里云服务器。
(第一,讲清楚当前开发者可获取的需求信息;第二,讲清楚开发后续需要完成的工作;第三,其它可公开的产品相关信息。个人建议:可从原型、设计、功能去描述项目当前的情况和需求,如果只有开发需交代原型和设计提供文档以及文档完整性,功能描述建议从产品使用者角色去描述主要功能和逻辑。)
三、参考项目
无
四、招募要求
招募对象
全栈工程师
具体要求
1、懂的爬虫技术;
2、有成功的爬虫开发经验者优先;
3、采用通用主流开发技术,参与悬赏时需要简要说明对产品的理解和准备采用的技术方案如开发语言等;
4、参与项目的开发成员需要提前熟掌握项目和代码管理工具coding的使用方法;
五、项目规划
个人开发
开发时间
30天
质保时间
2个月
开发费用
8000.00元(含税费)
交付成果
源代码、满足需求可正常使用的网站、网站布署配置文档、网站使用说明文档等。
交付方式
各类文档和源代码需上传到coding上指定的私有项目中,更新频率至少为2天/次;按照需求方指定的服务器、域名等条件完成网站部署和调优。
六、其它说明
详细的《项目开发阶段划分表》在项目启动开发前三方协定,码市平台按照该表根据阶段验收情况按阶段支付开发费。