網(wǎng)頁(yè)下載轉(zhuǎn)換器
發(fā)布時(shí)間:2013/10/12
慧峰網(wǎng)頁(yè)下載轉(zhuǎn)換器是網(wǎng)頁(yè)下載及網(wǎng)頁(yè)數(shù)據(jù)自動(dòng)獲取轉(zhuǎn)換程序。
下面給出網(wǎng)頁(yè)下載轉(zhuǎn)換器功能簡(jiǎn)介:
1、將網(wǎng)址對(duì)應(yīng)的動(dòng)態(tài)或者靜態(tài)網(wǎng)頁(yè)獲取到本地,并按照模板樣式進(jìn)行數(shù)據(jù)摘取和格式轉(zhuǎn)換,轉(zhuǎn)換后得到的網(wǎng)頁(yè)為靜態(tài)網(wǎng)頁(yè)。
1.1) 操作過(guò)程:添加要下載轉(zhuǎn)換的任務(wù)記錄,填寫(xiě)要轉(zhuǎn)換的網(wǎng)頁(yè)地址,設(shè)置成需要的樣式和數(shù)據(jù)模板文件,設(shè)置好獲取頻率即可。
1.2) 模板文件是包含要生成目標(biāo)文件樣式的文件。它可以定義目標(biāo)顯示樣式,比如背景色,字體顏色,基本內(nèi)容等。同時(shí)定義需要從下載網(wǎng)頁(yè)中獲取的部分,定義獲取內(nèi)容部分的格式如下:
模板中的上述格式內(nèi)容部分在查找到對(duì)應(yīng)內(nèi)容后要被替換掉,其中beginpos,prefix,subfix,default變量部分要用實(shí)際要查找的字符串替換。
beginpos :給出本部分從原文件中哪個(gè)位置開(kāi)始查找,如果不定義,可以設(shè)成0。前面有'+'或者'-'表示相對(duì)位置,即從當(dāng)前位置向后或者向前幾個(gè)位置開(kāi)始查找。
prefix: 表示要獲取部分在原網(wǎng)頁(yè)中開(kāi)始部分的標(biāo)記。
subfix: 表示要獲取部分在原網(wǎng)頁(yè)中結(jié)束部分的標(biāo)記。
設(shè)置好上述變量就可以定位到要獲取的內(nèi)容。如果網(wǎng)頁(yè)中沒(méi)有找到需要的內(nèi)容,則可用default設(shè)定的部分替代(如果不用替代則設(shè)置該值為空字符即可)。
如果設(shè)置prefix、subfix、default完全相同,則表示定位到找到的prefix位置后,之后的內(nèi)容都從該位置開(kāi)始,在其后查找。在模板查找格式的前面定義部分可以給出這個(gè)一個(gè)設(shè)置,用于標(biāo)記查找的開(kāi)始位置,這樣可以提高效率和避開(kāi)混淆。
特殊標(biāo)記功能:如果prefix、subfix標(biāo)記為特殊字符串,比如字符串:till_to_mybegin或者till_to_myend,則表示進(jìn)行特定的處理。如果prefix為till_to_mybegin表示找到后綴后,之前的所有內(nèi)容。subfix為till_to_myend表示找到前綴后,保存其后面所有內(nèi)容。(如果前綴第一個(gè)字符為<號(hào)則保存開(kāi)始位置包括該前綴部分,否則濾掉前綴部分)
如果prefix為include_myvirtual表示本部分要引入其它文件內(nèi)容,此時(shí)subfix部分給出要包含文件名(相對(duì)路徑,根目錄為目標(biāo)存儲(chǔ)位置),default標(biāo)記部分給出缺省包含文件內(nèi)容或者給出空不設(shè)置。此時(shí)beginpos部分應(yīng)該為0。該功能用于將從多個(gè)網(wǎng)頁(yè)上獲取的數(shù)據(jù)進(jìn)行綜合顯示。
1.3) 幾個(gè)注意事項(xiàng):
A) 如果要跨行查找字符串,可將換行用字符串"\n"代替,對(duì)于有些系統(tǒng)換行用"\r\n"。建議在獲取的時(shí)候測(cè)試下哪種情況下可以獲取就用那種方式代替實(shí)際的回車(chē)換行。
B) 查找部分字符串長(zhǎng)度不能超過(guò)255字節(jié)。
C) 包含數(shù)據(jù)的原網(wǎng)站頁(yè)面大小不能超過(guò)500KB。
D) 給出的原網(wǎng)址必須是最初的,不要經(jīng)過(guò)字符串轉(zhuǎn)換的,比如查找北京的天氣預(yù)報(bào),參數(shù)部分如果是中文“北京”,則不能用經(jīng)過(guò)重新編碼的網(wǎng)址來(lái)作為原網(wǎng)址。
E) 如果只給出原地址,沒(méi)有給出模板文件,則下載完整的原網(wǎng)頁(yè)(包括網(wǎng)頁(yè)內(nèi)包含的相關(guān)內(nèi)容,是完整可本地瀏覽網(wǎng)頁(yè)),不進(jìn)行任何替換。
F) 特殊標(biāo)記前后不要增加引號(hào)和空格。
2、將本地的Excel或者Word文檔自動(dòng)另存為靜態(tài)網(wǎng)頁(yè)。 注意:運(yùn)行本程序的主機(jī)上要安裝好相應(yīng)版本的MS Office組件。
2.1) 操作過(guò)程:只需將要轉(zhuǎn)換的.xls或者.doc后綴文檔作為一條記錄添加到列表中即可。
2.2) 對(duì)于.xls文檔,缺省只導(dǎo)出頁(yè)面1(Sheet1)對(duì)應(yīng)的內(nèi)容。如果想導(dǎo)出全部頁(yè)面(Sheet),則將配置文件中[Host]部分的GetOnlyFirst設(shè)置成0,否則設(shè)置成1。同時(shí)得到的其它網(wǎng)頁(yè)命名規(guī)則是缺省網(wǎng)頁(yè)名稱后依次增加2,3等。比如:保存文件名為index.htm,那么第二個(gè)Sheet導(dǎo)出的網(wǎng)頁(yè)名為index2.htm。
[Host]
GetOnlyFirst=0
2.3) 另存Excel或者Word文件時(shí),不啟用替換模板文件進(jìn)行替換,此時(shí)模板文件字段部分對(duì)應(yīng)的為滾動(dòng)樣式模板文件。對(duì)于另存為的網(wǎng)頁(yè)缺省不自動(dòng)滾動(dòng),如果希望其自動(dòng)滾動(dòng),則在替換模板文件名部分設(shè)置上滾動(dòng)模板文件。系統(tǒng)自帶的滾動(dòng)配置文件為:scrolltemplate.txt,可使用該滾動(dòng)模板文件或者參考該文件生成自己需要的模板文件。
3、提供網(wǎng)站服務(wù)器功能,提供標(biāo)準(zhǔn)的HTTP網(wǎng)站服務(wù)。
配置過(guò)程:需要在配置文件UrlToMyHtm.ini中設(shè)置:StartWebsite=1,并設(shè)置合適的服務(wù)端口號(hào)(如:WebsitePort=80)。注意:設(shè)置完畢后需要重新啟動(dòng)程序。