自己做的一个小程序 可采集、导出、模板、配置
原文链接: https://www.cnblogs.com/inday/archive/2009/05/07/1452287.html | 迁移自博客园
去年老婆要开个店铺,卖化妆品的,不过输入数据的时候真的头疼,因为我们是没有货源的,都是从代理那里找图片、介绍等,不过好在代理有个网站,闲来无事,就开发了这个小程序。
程序的功能:
1、采集数据
2、可配置的,只要输入一定的条件就能采任何东西了。
3、可导出成csv格式
4、可把数据导入到淘宝助手。
5、采集图片到本地。
6、可修改宝贝内容
7、可使用模板来进行描述
用了这个程序,1000多个商品,只用了一会就全部搞定了,不过还有些小bug,也懒得改了,自己用的反正。
先看看配置文件:
1
2
3
4
5
6
7
8
9
<add name=“MyCollection.Properties.Settings.MyCollectConnectionString”
10
connectionString=“Data Source=.\SQLEXPRESS;AttachDbFilename=|DataDirectory|\MyCollect.mdf;Integrated Security=True;Connect Timeout=30;User Instance=True”
11
providerName=“System.Data.SqlClient” />
12
13
14
<MyCollection.CollectSetting>
15
16
D:\办公\淘游馆\香水彩妆\商品图片</value>
17
18
19
D:\办公\淘游馆\香水彩妆\描述模板</value>
20
21
22
D:\办公\淘游馆\香水彩妆\描述模板\wenwen.html
23
24
</MyCollection.CollectSetting>
25
26
SaveImagePath:保存图片到本地的路径
SaveCSVPath:导出文件所在目录
HtmlTemplet:宝贝描述模板文件
大概的界面:
主界面
显示此项目中的采集的数据
单个商品的详细内容,用的是winform的Edit,感觉还不错。
下面是进行采集的配置,界面如下:
如果用过动易那种采集系统的话,应该对此还比较熟悉,大致的话都是通过截取指定地方获取数据的。大家也可以看看实例。
在采集中,我没有使用WebRequest,因为我测试下来XmlHttp好像更快一点,而且不仅仅是一点点。
在Collect.cs中,是一个采集的类库,我想应该能满足一些读者的需求了。
程序原先用2005开发的,不过我这次转换了一下,可能要2008才能打开了:P
东西很小,不过当时因为刚接触2.0,所以东西写的不好,也没时间去改了,今天拿上来献丑,希望大家也能继续拓展这个程序,如果觉得好,需要改进,大家也可以随意改动,不过最好能通知我下,谢谢了:)
PS:做网站这么多年,我的了解,做采集做的成功的,应该属大旗网和去哪儿这2个网站。
PS2:今天发表的Exception第三篇,写的实在太糟了,真对不起大家,后面我会改进一下的,不过最近真的很忙:(