Post by ujjalseo on Apr 4, 2024 4:47:22 GMT
更新日期:2022 年 6 月 5 日 原著:2019 年 1 月 18 日 當我進行網站設計專案時,我首先查看現有網站的基礎、資產、內容和整體結構。這樣做可以讓我全面了解用戶可用的所有內容。客戶通常會隨著時間的推移建立網站(這是正常的)。當這種情況發生時,會添加更多的內容,網站很快就會膨脹成難以管理的混亂狀態。 了解網站的架構可能是一項具有挑戰性的任務。大型網站上有很多移動部件。然而,您透過本練習獲得的價值可以讓您深入了解網站的結構。我傾向於發現大量內容隱藏在深層連結頁面的地下室中。 以下資訊將引導您了解我分析和剝離活動網站、運行爬網和過濾資料的方法。我也會分享你的方法。可以應用一些這些知識來為您帶來優勢! 第 1 步 – 爬行 取得您想要查看的 URL,並將其放入 Screaming Frog 等應用程式中。您可能需要許可證才能抓取超過 500 個頁面的網站。我為這個例子選擇了一些更簡單的東西。
貼上網站的連結並點擊「開始」將開始抓取過程。 Screaming Frog 中有很多很多令人驚嘆的功能、偏好設定等 巴西 電話號碼 等,但這篇文章並 bv 不是關於這些好東西,目前你真的可以使用任何工具。只需確保您使用的是可靠的爬蟲,以便您可以抓取所有頁面連結。 爬網應該看起來像這樣: 尖叫青蛙網站爬行 第 2 步 – 匯出 從 Screaming Frog 匯出 資料。點擊下拉式選單並選擇 HTML,然後將資料匯出到 CSV。 我喜歡將我的文件命名為CPP 尖叫青蛙文件 將文件上傳到 Google 雲端硬碟(如果您使用的是 Excel,則可以按照指示進行操作)。 CPP 谷歌表格 步驟 3 – 初步打磨 重要資訊– 開啟您最近上傳的檔案並先複製標籤/工作表。將原始選項卡重命名為“RAW”。 將重複的工作表命名為“CLEAN”。 ……現在是有趣的部分。當您上傳了可靠的爬網後,您可以開始將資料過濾成專案團隊可以理解的區塊。 準備毀滅 此過程中有幾個關鍵的子步驟。它們如下: 刪除您認為在典型爬網中不重要的列,例如內容類型、連結、大綱、比率等。保留您常用的所有內容,例如標題、描述、抓取程式碼(404、302 等)。 將主表列標題行設定為工作表的篩選器。這允許保留但隱藏數據,例如損壞或遺失的頁面。 過濾掉 302 和 404。
步驟 4 – 對發現結果進行分類 在工作表中插入一個新列並將其命名為「類別」。這將在分解文件方面發揮重要作用。 如果您仍然同意我的觀點,那麼是時候將內容分類了。您使用的命名約定完全取決於您。為了讓事情順利進行,我總是按 URL 的名稱對工作表進行排序。執行此操作對頁面進行分組,可以更輕鬆/更快地對頁面類別進行重大更新。 目標是讓該文件作為面向客戶的網站網站地圖的基礎,以滿足 UX/UI 設計師和數位行銷人員的需求。 分類方法 這部分相當簡單。透過各種排序方法,我對URL欄中的頁面進行了分類。最後,我想要一張透過標籤和顏色編碼將相似頁面分組在一起的工作表。這種排序使我能夠了解即時網站上的所有內容。 例如,我將瀏覽並尋找「blog-page/2」等部落格的動態 URL。這些是動態 URL,我將它們分類。我將在“關於”部分下獲取內容,並在類別欄中將所有“關於”類型頁面通常命名為“Main-About”。 當所有頁面都排序完畢後,我將對各個類別組進行顏色編碼,以便更容易掃描。 CPP 站點架構 這一切意味著什麼 當您完成工作表上的標籤和著色後,您就可以開始下一步了。根據您的角色,這可能意味著很多事情。就像了解特定頁面上的字數一樣,透過結合關鍵字研究、新內容計劃和現有內容傳輸計劃來分解網站地圖的未來版本。 此過程可協助您採用更詳細和更科學的方法來進行網站架構分析。在後面的文章中,我們會將這些數據與其他數據集合併,以便我們對網站的效能有強大的了解。 以下是本文迄今為止採取的行動的摘要/清單: 使用 Screaming Frog 之類的工具抓取網站。 匯出資料並將其上傳到 Google Drive。 複製選項卡/工作表,以便取得原始資料集。
貼上網站的連結並點擊「開始」將開始抓取過程。 Screaming Frog 中有很多很多令人驚嘆的功能、偏好設定等 巴西 電話號碼 等,但這篇文章並 bv 不是關於這些好東西,目前你真的可以使用任何工具。只需確保您使用的是可靠的爬蟲,以便您可以抓取所有頁面連結。 爬網應該看起來像這樣: 尖叫青蛙網站爬行 第 2 步 – 匯出 從 Screaming Frog 匯出 資料。點擊下拉式選單並選擇 HTML,然後將資料匯出到 CSV。 我喜歡將我的文件命名為CPP 尖叫青蛙文件 將文件上傳到 Google 雲端硬碟(如果您使用的是 Excel,則可以按照指示進行操作)。 CPP 谷歌表格 步驟 3 – 初步打磨 重要資訊– 開啟您最近上傳的檔案並先複製標籤/工作表。將原始選項卡重命名為“RAW”。 將重複的工作表命名為“CLEAN”。 ……現在是有趣的部分。當您上傳了可靠的爬網後,您可以開始將資料過濾成專案團隊可以理解的區塊。 準備毀滅 此過程中有幾個關鍵的子步驟。它們如下: 刪除您認為在典型爬網中不重要的列,例如內容類型、連結、大綱、比率等。保留您常用的所有內容,例如標題、描述、抓取程式碼(404、302 等)。 將主表列標題行設定為工作表的篩選器。這允許保留但隱藏數據,例如損壞或遺失的頁面。 過濾掉 302 和 404。
步驟 4 – 對發現結果進行分類 在工作表中插入一個新列並將其命名為「類別」。這將在分解文件方面發揮重要作用。 如果您仍然同意我的觀點,那麼是時候將內容分類了。您使用的命名約定完全取決於您。為了讓事情順利進行,我總是按 URL 的名稱對工作表進行排序。執行此操作對頁面進行分組,可以更輕鬆/更快地對頁面類別進行重大更新。 目標是讓該文件作為面向客戶的網站網站地圖的基礎,以滿足 UX/UI 設計師和數位行銷人員的需求。 分類方法 這部分相當簡單。透過各種排序方法,我對URL欄中的頁面進行了分類。最後,我想要一張透過標籤和顏色編碼將相似頁面分組在一起的工作表。這種排序使我能夠了解即時網站上的所有內容。 例如,我將瀏覽並尋找「blog-page/2」等部落格的動態 URL。這些是動態 URL,我將它們分類。我將在“關於”部分下獲取內容,並在類別欄中將所有“關於”類型頁面通常命名為“Main-About”。 當所有頁面都排序完畢後,我將對各個類別組進行顏色編碼,以便更容易掃描。 CPP 站點架構 這一切意味著什麼 當您完成工作表上的標籤和著色後,您就可以開始下一步了。根據您的角色,這可能意味著很多事情。就像了解特定頁面上的字數一樣,透過結合關鍵字研究、新內容計劃和現有內容傳輸計劃來分解網站地圖的未來版本。 此過程可協助您採用更詳細和更科學的方法來進行網站架構分析。在後面的文章中,我們會將這些數據與其他數據集合併,以便我們對網站的效能有強大的了解。 以下是本文迄今為止採取的行動的摘要/清單: 使用 Screaming Frog 之類的工具抓取網站。 匯出資料並將其上傳到 Google Drive。 複製選項卡/工作表,以便取得原始資料集。