去年老婆要開個店鋪,賣化妝品的,不過輸入資料的時候真的頭疼,因為我們是沒有貨源的,都是從代理那裡找圖檔、介紹等,不過好在代理有個網站,閑來無事,就開發了這個小程式。
程式的功能:
1、采集資料
2、可配置的,隻要輸入一定的條件就能采任何東西了。
3、可導出成csv格式
4、可把資料導入到淘寶助手。
5、采集圖檔到本地。
6、可修改寶貝内容
7、可使用模闆來進行描述
用了這個程式,1000多個商品,隻用了一會就全部搞定了,不過還有些小bug,也懶得改了,自己用的反正。
先看看配置檔案:
1
<?xml version="1.0" encoding="utf-8" ?>
2
<configuration>
3
<configSections>
4
<sectionGroup name="userSettings" type="System.Configuration.UserSettingsGroup, System, Version=2.0.0.0, Culture=neutral, PublicKeyToken=b77a5c561934e089" >
5
<section name="MyCollection.CollectSetting" type="System.Configuration.ClientSettingsSection, System, Version=2.0.0.0, Culture=neutral, PublicKeyToken=b77a5c561934e089" allowExeDefinition="MachineToLocalUser" requirePermission="false" />
6
</sectionGroup>
7
</configSections>
8
<connectionStrings>
9
<add name="MyCollection.Properties.Settings.MyCollectConnectionString"
10
connectionString="Data Source=.\SQLEXPRESS;AttachDbFilename=|DataDirectory|\MyCollect.mdf;Integrated Security=True;Connect Timeout=30;User Instance=True"
11
providerName="System.Data.SqlClient" />
12
</connectionStrings>
13
<userSettings>
14
<MyCollection.CollectSetting>
15
<setting name="SaveImagePath" serializeAs="String">
16
<value>D:\辦公\淘遊館\香水彩妝\商品圖檔\</value>
17
</setting>
18
<setting name="SaveCSVPath" serializeAs="String">
19
<value>D:\辦公\淘遊館\香水彩妝\描述模闆\</value>
20
21
<setting name="HtmlTemplet" serializeAs="String">
22
<value>D:\辦公\淘遊館\香水彩妝\描述模闆\wenwen.html</value>
23
24
</MyCollection.CollectSetting>
25
</userSettings>
26
</configuration>
SaveImagePath:儲存圖檔到本地的路徑
SaveCSVPath:導出檔案所在目錄
HtmlTemplet:寶貝描述模闆檔案
大概的界面:
主界面
顯示此項目中的采集的資料
單個商品的詳細内容,用的是winform的Edit,感覺還不錯。
下面是進行采集的配置,界面如下:
如果用過動易那種采集系統的話,應該對此還比較熟悉,大緻的話都是通過截取指定地方擷取資料的。大家也可以看看執行個體。
在采集中,我沒有使用WebRequest,因為我測試下來XmlHttp好像更快一點,而且不僅僅是一點點。
在Collect.cs中,是一個采集的類庫,我想應該能滿足一些讀者的需求了。
程式原先用2005開發的,不過我這次轉換了一下,可能要2008才能打開了:P
東西很小,不過當時因為剛接觸2.0,是以東西寫的不好,也沒時間去改了,今天拿上來獻醜,希望大家也能繼續拓展這個程式,如果覺得好,需要改進,大家也可以随意改動,不過最好能通知我下,謝謝了:)
<a href="http://files.cnblogs.com/inday/MyCollection.rar">點選下載下傳</a>
PS:做網站這麼多年,我的了解,做采集做的成功的,應該屬大旗網和去哪兒這2個網站。
PS2:今天發表的Exception第三篇,寫的實在太糟了,真對不起大家,後面我會改進一下的,不過最近真的很忙:(