三流君 ken3のmemo置き場

三流プログラマーのメモ書きです。主にVBAやWindowsの話題が多いです

挨拶・自己紹介:
失敗続きのAB型の変わり者 :三流プログラマー Ken3です
フリーのエンジニア・個人事業主です・・と書くと聞こえはイイが(それとなくカッコよく聞こえるが)、 現在は小さな案件の受注請負 と 短期派遣 で 日々つつましく?ほそぼそと暮らしてます。
よく検索されるキーワード: [質問回答XXXXさんへ] [CreateObject] [VBA] [JRA競馬オッズ]

XXXXXさんへ スクレイピング関連の質問について 年金関連のqaページ

下記の質問をいただく、
(が、いつものように、できない、難しい・・・の後ろ向き回答、ぉぃぉぃ)

>さてこのたび仕事の関係で某厚生労働省の年金関連のqaページをエクセルの表にして抽出したいと考えています。最低限A列にQ(質問内容)、B列に(回答内容)という感じ。質問したいことは、①これを達成することはvbaだけで可能でしょうかそれとも別のアプリケーション?やなにか別のプログラミング知識が必要でしょうか?②仮にKen3様が(その経験・知識をもってして)それを実行しようと思った場合、どの程度の時間を必要と考えますか?

年金関連のqaページ
https://www.nenkin.go.jp/faq/n_net/toroku/moshikomi/20150519.html
などから、
>最低限A列にQ(質問内容)、B列に(回答内容)
だと思いますが、
これは、下記、<を外したソースですが、


div class="h1bg faq_title">div>h1>img src="/images/2020_faqTitle_icon.png" alt=Q.>自分の基礎年金番号の確認方法を教えてください。/h1>/div>/div>

div class="h2bg answer_h2">div>h2>span class=answer_h2_img>
span class=answer_h2_txt>お答えします/span>/h2>/div>/div>



div class="h1bg faq_title"

div class="h2bg answer_h2"
など、
名前が規則的についていそうなので、
>①これを達成することはvbaだけで可能でしょうか
なんとか、なりそうな気もしますが、

全てのQAを取得する時に、
一覧や規則性があると、一度に取得するのが楽そうですが、
TOPのページから、
https://www.nenkin.go.jp/faq/index.html
から、階層が深いので、
たどっていくのが、再帰処理したり
大変かなぁ。

>それとも別のアプリケーション?やなにか別のプログラミング知識が必要でしょうか?

私も詳しくないので、なんとも言えませんが、
TOPのページから、
https://www.nenkin.go.jp/faq/index.html
から、一括ダウンロードのソフトなどがあると、いいのかなぁ。
でも、あっても、そのソフトのデータからQAを抜くから、そこで問題か・・・

>②仮にKen3様が(その経験・知識をもってして)それを実行しようと思った場合、どの程度の時間を必要と考えますか?

やってみないと、わからないかなぁ。
打ち合わせ含め、二週間とか?で出すと、
安易に考えると、痛い目みるのと、
今回みたいに、二週間とか余裕を持ちすぎると
お客さんに
「えっ、そんなにかかるの?Pythonでライブラリ使いスグにできるでしょ」
と、最近ならお客様に言われるかなぁ。

google:Python スクレイピング 単価
などで、検索すると、みんな安いですね。
「Python スクレイピング」から探す | ココナラ
https://coconala.com/search?keyword=Python%20%E3%82%B9%E3%82%AF%E3%83%AC%E3%82%A4%E3%83%94%E3%83%B3%E3%82%B0
など、いろいろ出てくるので、参考にしてみては?

QA全取得、階層処理がめんどうかなぁ

印象です

よい業者さんやツールが見つかるといいですね。 三流プログラマー Ken3



ここから蛇足の独り言

せっかく、質問をいただいたのに、
いつものように、難しいかも・・・他店を参考にするといいのでは?
の後ろ向き回答、
いいかげんにしろ・・・自分・・・
危険な匂いがしても、チャレンジしろよ自分、、、

Ken3 ホームページ 目次

分類:HPを大きく分けると4つの柱(分類)です。
・[Excel/Access VBA]の解説
・[ASP(Active Server Pages)]の解説。
・[元コンビニ店長時代の話]が弟に巻き込まれ、失敗した脱サラ、畑違い?の仕事で失敗。
・[プログラマーの愚痴]では、あまり見せたくない三流プログラマーの内面かな。
三流君を踏み台にする
主に上記4つの分類でHP作成やメルマガの発行を行ってます。
※更新頻度が落ちていて情報の鮮度が悪いです。



本当に三流なんです(笑):たまにスゴイですねなんて言われることもありますが、
真実は→ [三流君の真実は...] ←を初めに見てくださるとわかると思います。
(からくりは、成功例↑しか載せてなくて ヒドイ失敗例はお蔵入り迷宮入りが多かったりします)