Discussion:
[問題]:想請教如何取出excel與powepoint內之文字
(时间太久无法回复)
一葉扁舟(man)
2003-07-22 05:42:44 UTC
Permalink
大大:
我實在不懂你的意思耶!
所謂內的文字是什麼意思???
如:abc.xls,你想要把abc取出???
如果是這樣,這好像沒什麼用途!
打擾了,因為不確定這問題該po在哪,如果有不妥的地方,還請見諒。 ^_^A"
想請問一下大家
如何將 .xls檔(Excel的副檔名) 與 .ppt檔(powerpoint的副檔名)內的文字取出?
如果諸位有方法的話,敬請回覆告知,感激不盡 ^^~
p.s目前只知如何取出 .doc 與 .pdf內之文字
--

山靜雲閒 如是機緣如是法

鳥鳴花放 爾時休息爾時心

--
* Origin: 中山大學-美麗之島BBS * From: 218.165.28.37 [已通過認證]
鏡花水月
2003-07-22 19:03:29 UTC
Permalink
如果你是想在不開啟檔案的情況下將文字取出,
那你大概要自己寫一點點 script (eg. VB, Perl ).
大概來說, 因為 word 的機制比較簡單, 類似於 html,
所以比較容易擷取, 但 xls 跟 ppt, 則是跟 object / class
的東東混在一起, 所以, 不會容易.... 不過如果你會用
Perl 的話, 可以試試 : Spreadsheet::PhraseExcel 這個 module.

我比較希望你的情況不是上的面的一種... 如果是在開啟檔
案的情況下擷取, 只要很簡單的按 Ctrl - A, 再 Ctrl - Insert, 再
開個記事本, 然後 Shift - Insert 這樣說可以大功告成了.
打擾了,因為不確定這問題該po在哪,如果有不妥的地方,還請見諒。 ^_^A"
想請問一下大家
如何將 .xls檔(Excel的副檔名) 與 .ppt檔(powerpoint的副檔名)內的文字取出?
如果諸位有方法的話,敬請回覆告知,感激不盡 ^^~
p.s目前只知如何取出 .doc 與 .pdf內之文字
--
※ Origin: 楓橋驛站<bbs.cs.nthu.edu.tw> ◆ From: EDMLab.ie.nthu.edu.tw
>> 移居上海徐家匯 <<
2003-07-23 02:47:42 UTC
Permalink
打擾了,因為不確定這問題該po在哪,如果有不妥的地方,還請見諒。 ^_^A"
想請問一下大家
如何將 .xls檔(Excel的副檔名) 與 .ppt檔(powerpoint的副檔名)內的文字取出?
如果諸位有方法的話,敬請回覆告知,感激不盡 ^^~
p.s目前只知如何取出 .doc 與 .pdf內之文字
用 filter
有一家公司叫做 Stellent, Inc. 他們有個東西是 OIVT
Outside In Viewer Technology 可以把一些檔案裡頭的文字給抽出來

.doc 你是怎麼做 轉成 .rtf 然後也是抽出文字
.pdf 的話 Adobe 有 SDK 可以抽出文字

--
-
交大資科 BSD/Chinese/Chinfost/Coffee/Database/Destiny/Economics/FoodStuff
GreenEarth/MB/Mobile-comm/Multimedia/PDA/Radio/Security/Tea/Wine/X-files 板主
O, God, the sea is so great and my boat is so small <<<<<
--
* Post by Mild7 from telnet.hinet.net
* Origin: ★ 交通大學資訊科學系 BBS ★ <bbs.cis.nctu.edu.tw: 140.113.23.3>
Loading...