下記の質問をいただく、
(が、いつものように、できない、難しい・・・の後ろ向き回答、ぉぃぉぃ)
>さてこのたび仕事の関係で某厚生労働省の年金関連のqaページをエクセルの表にして抽出したいと考えています。最低限A列にQ(質問内容)、B列に(回答内容)という感じ。質問したいことは、①これを達成することはvbaだけで可能でしょうかそれとも別のアプリケーション?やなにか別のプログラミング知識が必要でしょうか?②仮にKen3様が(その経験・知識をもってして)それを実行しようと思った場合、どの程度の時間を必要と考えますか?
年金関連のqaページ
https://www.nenkin.go.jp/faq/n_net/toroku/moshikomi/20150519.html
などから、
>最低限A列にQ(質問内容)、B列に(回答内容)
だと思いますが、
これは、下記、<を外したソースですが、
div class="h1bg faq_title">div>h1>img src="/images/2020_faqTitle_icon.png" alt=Q.>自分の基礎年金番号の確認方法を教えてください。/h1>/div>/div>
div class="h2bg answer_h2">div>h2>span class=answer_h2_img>
span class=answer_h2_txt>お答えします/span>/h2>/div>/div>
div class="h1bg faq_title"
や
div class="h2bg answer_h2"
など、
名前が規則的についていそうなので、
>①これを達成することはvbaだけで可能でしょうか
なんとか、なりそうな気もしますが、
全てのQAを取得する時に、
一覧や規則性があると、一度に取得するのが楽そうですが、
TOPのページから、
https://www.nenkin.go.jp/faq/index.html
から、階層が深いので、
たどっていくのが、再帰処理したり
大変かなぁ。
>それとも別のアプリケーション?やなにか別のプログラミング知識が必要でしょうか?
私も詳しくないので、なんとも言えませんが、
TOPのページから、
https://www.nenkin.go.jp/faq/index.html
から、一括ダウンロードのソフトなどがあると、いいのかなぁ。
でも、あっても、そのソフトのデータからQAを抜くから、そこで問題か・・・
>②仮にKen3様が(その経験・知識をもってして)それを実行しようと思った場合、どの程度の時間を必要と考えますか?
やってみないと、わからないかなぁ。
打ち合わせ含め、二週間とか?で出すと、
安易に考えると、痛い目みるのと、
今回みたいに、二週間とか余裕を持ちすぎると
お客さんに
「えっ、そんなにかかるの?Pythonでライブラリ使いスグにできるでしょ」
と、最近ならお客様に言われるかなぁ。
google:Python スクレイピング 単価
などで、検索すると、みんな安いですね。
「Python スクレイピング」から探す | ココナラ
https://coconala.com/search?keyword=Python%20%E3%82%B9%E3%82%AF%E3%83%AC%E3%82%A4%E3%83%94%E3%83%B3%E3%82%B0
など、いろいろ出てくるので、参考にしてみては?
QA全取得、階層処理がめんどうかなぁ
が
印象です
よい業者さんやツールが見つかるといいですね。 三流プログラマー Ken3
ここから蛇足の独り言
せっかく、質問をいただいたのに、
いつものように、難しいかも・・・他店を参考にするといいのでは?
の後ろ向き回答、
いいかげんにしろ・・・自分・・・
危険な匂いがしても、チャレンジしろよ自分、、、