網(wǎng)頁文本采集大師是一款專門用于批量采集、復(fù)制或者說是下載網(wǎng)絡(luò)上的文章或者是小說,甚至是整個網(wǎng)站文字內(nèi)容的工具,不管是靜態(tài)的網(wǎng)站,還是動態(tài)的網(wǎng)站,只要有文字,它都能夠獲取,只要輸入簡單的幾條信息,就可自動批量為你下載復(fù)制網(wǎng)絡(luò)文章了,可謂是輕松快捷。
網(wǎng)絡(luò)信息時代,天天上網(wǎng),經(jīng)常會遇到喜歡的文章,或者是小說等,小則一兩頁,多則幾十頁,甚至上百頁、上千頁,這么多文字,要復(fù)制下載就顯得非常的麻煩,本來要頻繁的在記事本和網(wǎng)頁瀏覽器上切換就已經(jīng)夠難過的了,現(xiàn)在還面臨著要同時做這種枯燥的機械的動作幾十次、幾百次的問題,到底有沒有更簡單、高效、省力的辦法呢? 這不,我們開發(fā)的“網(wǎng)頁文本采集大師”就是這么一款專門為你準備的工具軟件。 除了抓取網(wǎng)上的文章,你還可以用它來抓取一些特殊的信息,比如抓取百度詞典上的信息,或者你也可以用它抓取一些網(wǎng)頁上的鏈接地址。 另外本軟件還具有很多其它的功能,比如文本段落重排、文本合并、文件批量改名等功能,非常實用,要知道時間就是生命,可以讓電腦為你工作的事,你千萬不要自己去做,快下載用用看吧,希望你會喜歡上她。1、關(guān)于網(wǎng)頁網(wǎng)址的獲取
要采集文章,首先要知道該文章所在的網(wǎng)址,本軟件就是通過各種方法獲取的網(wǎng)址和幾個采集的關(guān)鍵字去獲取網(wǎng)上的文章的,因此在采集文章前,你先要提供文章所在的網(wǎng)址,這個網(wǎng)址你可以預(yù)先用記事本,按一行一個地址收集保存后,用本軟件導(dǎo)入
如果你正在上網(wǎng),看到一篇小說不錯,而且你已經(jīng)打開了該小說的目錄頁,那么,你在打開本軟件后,使用“復(fù)制已打開瀏覽器中的鏈接”功能也可一次性收集到這些地址,你再刪除一些不需要的后,選定這些地址,即可導(dǎo)入網(wǎng)址列表。
當然通常的做法,就是在軟件中輸入文章目錄頁地址,文章正文網(wǎng)址鏈接關(guān)鍵字后,讓軟件收集這些地址。
2、關(guān)于網(wǎng)頁文本的采集
有了文章的地址,我們在打開這些文章后,一般這些文章的前后都會有大量網(wǎng)站上的相關(guān)信息,比如廣告等,所以還得分離出我們需要的正文,所以就要設(shè)置正文的起始和結(jié)束關(guān)鍵字,這個關(guān)鍵字是指正文開始前出現(xiàn)的,而且在該頁面上是唯一的文字串,但是這個文字串又是在每篇文章前都有的,你輸入一段即可,結(jié)束關(guān)鍵字也一樣,輸入了起始和結(jié)束關(guān)鍵字,就可獲取文章了,你可以先打開一個網(wǎng)址試試的。
如果這個網(wǎng)址打開后,整個頁面很干凈,沒有其它任何不需要的文字的話,這些關(guān)鍵字就不用設(shè)置了。
3、關(guān)于文章標題關(guān)鍵字
這是為了獲取文章標題,也是為了保存文件所用的,很多時候,我們獲取的文章,它的首行就是這一篇文章的標題,而且每一個網(wǎng)址后打開都不一樣,那么我們就可不用輸入起始和結(jié)束關(guān)鍵字,軟件將會自動以第一行為標題保存文件。
小編提示:360會對該軟件進行殺毒報警,如果你想繼續(xù)使用的話,建議下載后殺毒使用。