我發現一件事情 我好像犯了一個巨大錯誤
拆分子網域 不代表就會被 google 視為多個獨立站
如果內容大同小異 只有 ui 文字不同 那還是會被視為翻譯站
翻譯站,應該要有 canonical url 以及 alternate links hreflang 彼此互相指向
這樣一來 google 只收錄母網域的內容 這其實比較理想 這樣權重就可集中
我現在遇到困擾 香港站 越南站 連首頁、產生器首頁 都不被收錄(已檢索 - 目前尚未建立索引)
根本不該這樣
獨立站,就不應該放 alternate links 指向彼此
甚至放 canonical 自己指向自己 講清楚我真的獨立 還比較好
然後需要各自的 sitemap
最重要的是 資源應該要獨立
比方說 jp site /memes/123
如果能打開 那麼 vn site /memes/123
應該要是 404
這樣才有資源獨立的感覺
我之前因為趕時間 隨便寫 我以為不會被爬蟲找到 其實 在用戶總資料頁面 還是有連結
就算都沒有 google bot 也可能拿資源路徑 多換幾個子網域嘗試 看看資源是否獨立
走向國際 應該在一開始就思考清楚 我是要做翻譯站 還是多個獨立站
我之前一直沒想清楚 都做半套 我自己都不知道是做翻譯站還是獨立站
於是 被 google 認定為:想假裝成多個獨立站的翻譯站 濫用大量索引 視為低級網站 然後被懲處
chatgpt 補充
✅ 類比說明
就像 Booking.com 跟 Agoda 一樣都支援多語系,但:
如果 Agoda 日本站放的是日本特有飯店,越南站是越南飯店
那這兩頁就不是「語言版本」,而是「內容上獨立的頁面」
Google 就會希望你獨立處理索引,不然只會收錄其中一個,其他可能會變成「duplicate or alternate language」。
看看 雖然是同個網域 用路徑區分
但這兩頁就不會是語言版本 而是獨立的頁面
我之前那種機關槍式的撒下索引 看看 google 怎樣收錄、給我流量的策略
可說是太天真了
在索引 已檢索 - 目前尚未建立索引 選檢查網址
看到發現方式特別把 Sitemap 列出來
代表有放 sitemap 真的有差吧
如果真的不懂某些網址怎會被收錄
也可以在 參照網頁
的地方看到 是如何被 google 找到的
乾貨 一山還有一山高