## page was copied from DnsTemplate ##master-page:HelpTemplate = html2wiki = <> <> http://moinmo.in/HtmlConverter pythonにはhtml.parserがあるので、それを利用するのが楽だ。 python で書かれたものが動く。(wgetなどでは接続エラーになる。) == 動機 == 全文検索をやりたい。moinサイトはtext検索が復活して、使えている。 wnで動かしていたサイトもあって、以前は(全文)検索に重宝していたのだが、現在は使えなくなっている。[[httpserver]] ということで、html をwikiに変換してしまえば、という怠けものの発想である。 -- ToshinoriMaeno <> wnなどを復活するとか、htmlページ検索ツールを動かすという手もある。 こっちの方向でも調べてみよう。wnはなさそう。 -- ToshinoriMaeno <> == HtmlConverter == http://moinmo.in/HtmlConverter リンク切れが多い。 https://docs.python.org/ja/3/library/html.parser.html https://qiita.com/rtok/items/7ae9be2ae531bb21614f Perl版もある。 http://manpages.ubuntu.com/manpages/cosmic/man1/html2wiki.1p.html {{{ Command 'html2wiki' not found, but can be installed with: sudo apt install libhtml-wikiconverter-perl }}} == html parser == [[python/html.parser]] を利用する方法もある。 [[ParserMarket]] https://docs.python.org/ja/3/library/html.parser.html https://naruport.com/blog/2019/11/14/python-html-parser/ == beautifulsoup4 == これを使うのが楽そうだが、installは? [[/BeautifulSoup4]] https://www.crummy.com/software/BeautifulSoup/ https://www.crummy.com/software/BeautifulSoup/bs4/doc/ https://pypi.org/project/beautifulsoup4/ == history == {{{ }}} ---- CategoryDns CategoryWatch CategoryTemplate