Board logo

標題: 請問有咩方法可以寫到一個小程式,自動將呢個網頁嘅內容轉成清單? [打印本頁]

作者: 永恆的回憶    時間: 2022-1-27 19:57     標題: 請問有咩方法可以寫到一個小程式,自動將呢個網頁嘅內容轉成清單?

如題,網頁是這個:https://my.viewranger.com/user/details/3966580

想將特定 user 的 "My Tracks" 全部連結 retrieve 成 text,到時再 batch download,
但係佢唔係 static HTML,每次襟 "Next 10 tracks" 先會出下十個 tracks,
請問有無大大知點做?
作者: A4Paper    時間: 2022-1-27 22:36

提示: 作者被禁止或刪除 內容自動屏蔽
作者: A4Paper    時間: 2022-1-27 22:39

提示: 作者被禁止或刪除 內容自動屏蔽
作者: 永恆的回憶    時間: 2022-1-28 00:24

回覆 2# A4Paper

謝謝你的解答
想請問如果我想將上面的 result 自動整理成十行 hyperlink,又有無 regex 可以做到啊?
作者: A4Paper    時間: 2022-1-28 01:48

提示: 作者被禁止或刪除 內容自動屏蔽
作者: 永恆的回憶    時間: 2022-1-28 04:28

本帖最後由 永恆的回憶 於 2022-1-28 04:51 編輯

回覆 5# A4Paper

Thanks so much! 開始有啲眉目了。
想再請教大大,呢啲網頁 (例如 https://my.viewranger.com/track/details/MjE2NzE4NDI),係咪無可能用簡單方法可以將地圖上面啲線條 save 成為 gpx 或其他向量檔案?
如果太難嘅話,就只好還原基本,用以下方法批圖截圖:
  1. "C:\Program Files (x86)\Google\Chrome\Application\chrome.exe" --headless --disable-gpu --enable-logging --screenshot="C:\Users\xxxx\screenshot.png" --window-size=1464,1500 "https://my.viewranger.com/track/details/MjE2NzE4NDI="
複製代碼

作者: A4Paper    時間: 2022-1-28 11:40

提示: 作者被禁止或刪除 內容自動屏蔽
作者: 永恆的回憶    時間: 2022-1-31 12:07

回覆 7# A4Paper

謝謝你嘅資訊,我做咗一部分之後,https://reqbin.com/post/online 呢個網頁就移除咗,
呢家想搵替代品但唔知點搵,其實有無軟件可以做到同類嘅事啊?
作者: A4Paper    時間: 2022-1-31 12:51

提示: 作者被禁止或刪除 內容自動屏蔽
作者: A4Paper    時間: 2022-1-31 12:55

提示: 作者被禁止或刪除 內容自動屏蔽
作者: shal    時間: 2022-1-31 13:49

本帖最後由 shal 於 2022-1-31 15:45 編輯
回覆  A4Paper

Thanks so much! 開始有啲眉目了。
想再請教大大,呢啲網頁 (例如 ),係咪無可能用簡單方 ...
永恆的回憶 發表於 2022-1-28 04:28



用python
urllib + BeautifulSoup
己可以好簡單做到

用urllib.request
loop https://my.viewranger.com/user/t ... 3966580&page=10
個page值 直到沒野就出就停
python 做文字轉換好簡單

用 selenium chromedrive 可以只cap指定一個div ,以下系用VS Code + ipynb

作者: 永恆的回憶    時間: 2022-2-1 13:57

回覆 10# A4Paper


謝謝你,經提醒我發現原來 Chromium DevTools 裡面本身已經有得直接 copy 段嘢,連個網都唔使用。
經過兩日努力,終於將成千條 track download 晒落嚟,我發現原來嗰段路線係 JSON,
我用你嗰網,逐條 track 嘅 JSON 轉為 CSV,開 Excel 寫個 Marco 批量改下 format 再 batch convert 做 GPX 就完全做到我最想做嘅效果,比當初諗 screenshot 仲完美!

新年快樂!





歡迎光臨 電腦領域 HKEPC Hardware (https://h2.hkepc.com/forum/) Powered by Discuz! 7.2