▋自學爬蟲
這在以前是非常困難的事但現在有AI一切不同了以前我曾買過PYTHON的書
但看書要學會,不切實際
反而跟AI一來一往,快速就能搞定
你不用真的會,只需要理解個架構就可
我靠跟chatgpt溝通做到了什麼事?
1.架設好python的環境,以前光是這步就搞死人了,要安裝的插件數頗多
2.請gpt擷取評議決定書中關於保險的所有連結
3.請gpt下載所有連結,連結為pdf檔,共計17439個檔案
4.請gpt提取所有pdf文字,轉成txt,txt的文件較小,後續餵給大模型較容易
5.請gpt刪除特定文字,減少檔案大小
6.請gpt依字數上限合併檔案,字數過度,大模型難負荷
▋google服務
本來我是想自己架設大語言模型來跑的
但難度較高,無法短時間完成
改由google已有的免費服務notebooklm
notebooklm可以做到的事
跟我想做的事完全一樣
只根據資料來源回答問題,不會自己亂回答
且每個回答都有附上來源依據
因此我改用notebooklm
一切就簡單非常多了
▋未來升級
之後我會想再爬蟲兩個來源
1.保險相關的司法院裁判書
2.所有保險條款
但這兩個網站設計的較複雜
需要時間再研究才可能成功
如果成功,未來這機器人就能根據
保險條款、各式理賠爭議、契約爭議、保險相關法律
給出最有憑有據的答案
成為AI中的保險專用機器人
那因為這是GOOGLE的服務
無法直接對外開放
需要我授權過的GMAIL,才有辦法使用
所以如果想試試,就到這留GMAIL吧
https://docs.google.com/forms/d/e/1FAIpQLSeRYnN4rbeVtionaR-JqI3DGUSP1Y8y48KNn4_QnPok16zulg/viewform?usp=header