2005/09/22

エクセルからWEBにアクセスしてタグをそぎ落とした上で、テキスト表示する

エレメントとコレクションにおけるスクリプト記述
「1」に関してのみですが、以下のVBAでWebの文書をエクセルに取得することが出来ます。 キモは、IE.documentの扱い方なので、上記のURLを参照に頑張ってみてください。 Dim IE As Object Dim RegExp As Object Sub タグそぎ落とし表示() Dim sHTML As String ’初期設定 Set IE = CreateObject(”InternetExplorer.Application”) Set RegExp = CreateObject(”VBScript.RegExp”) RegExp.IgnoreCase = True RegExp.Global = True ’HTML取得 Call IE.Navigate(”http://onisci.com/614.html”) Call WaitIE sHTML = IE.document.body.innerHtml ’HTML編集 ’ -> 改行 RegExp.Pattern = vbCr: sHTML = RegExp.Replace(sHTML, ””) RegExp.Pattern = vbLf: sHTML = RegExp.Replace(sHTML, ””) RegExp.Pattern = ” ”: sHTML = RegExp.Replace(sHTML, vbLf) ’タグを全消し RegExp.Pattern = ”<[^>]+>”: sHTML = RegExp.Replace(sHTML, ””) ’HTML表示 Range(”A1”).Value = sHTML End Sub Sub WaitIE() ’待ち While (IE.busy): Wend While (IE.document.readyState <> ”complete”): Wend End Sub