A/B 測試規劃器
想優化某個東西卻不知道怎麼測?輸入你想改善的目標,AI 幫你定義要測哪個變因、設計 A/B 兩版、選對判勝指標、估該跑多少量與天數,給你一張照著做就能上的測試計畫。
登入領點數免費試用 · 每次產生扣 2 點 · 點數跨 LUVAI 全站共用
「🎲 載入範例」看看它能做什麼(不扣點)。
怎麼運作
你填想改善的目標、打算測試的位置(主圖/標題/價格/廣告/落地頁/結帳等)、以及大概的現有流量或轉換率,AI 會幫你把測試聚焦成單一變因,設計出 A(對照)與 B(實驗)兩個版本的具體差異,指定一個主要判勝指標與一兩個輔助指標,並用你的流量粗估每版大約需要多少樣本、跑幾天才足以判讀,最後列出這個測試最容易踩的陷阱與停止規則。
什麼時候用得上
- ✓蝦皮主圖換了一張新的,想科學地測『新主圖到底有沒有讓點擊率變高』,需要一份怎麼測、看哪個指標、跑幾天的計畫
- ✓自架官網商品頁想把 CTA 從『立即購買』改成『加入購物車』,不確定哪個轉換好,要設計 A/B 測試
- ✓Meta 廣告想測『痛點型 vs 優惠型』兩版文案哪個 CTR 高,需要知道每版至少要跑到多少曝光才算數
- ✓想測落地頁要不要放『限時倒數』,但怕樣本太少看到的差異只是運氣,需要 AI 幫忙估該收集多少資料
- ✓團隊常憑感覺改賣場又說不清有沒有效,需要一套標準化的測試規劃,把『改一個變因、看一個主指標』的紀律建立起來
使用小技巧
- ·一次只改『一個』變因。同時換主圖又改價格,贏了你也不知道是誰的功勞,下次無法複製
- ·測試前先想清楚『主指標』只能有一個(例:點擊率或購買轉換率),輔助指標當參考;主指標沒贏就別硬說有效
- ·流量太小的賣場別測太細的東西(例:按鈕顏色),差異需要的樣本量會大到跑很久;先測影響大的(主圖、價格、訴求角度)
- ·測試期間不要中途偷看一兩天就喊贏,早期波動很大;讓它跑滿規劃天數或樣本量再判讀,避免被假象騙
- ·蝦皮無法做嚴格同時分流的 A/B,多半只能用『前後對照』(換之前一週 vs 換之後一週),要盡量讓兩段期間的檔期、流量來源相近,結論才可信
平台特化提醒
蝦皮/momo:平台不提供原生 A/B 分流,實務上多用『前後期對照』——同一商品換素材前後各跑一段相近條件的期間比較,務必避開大促與平日混比。自架官網:可用 GA4+Google Optimize 替代方案、或前端工具做真正的同時分流;結帳流程類測試要注意樣本累積慢。廣告平台:Meta 有原生 A/B test(廣告實驗)、Google Ads 有實驗草稿,建議用平台內建分流以排除時間因素。
常見問題
蝦皮、momo 沒辦法像網站那樣同時分流,這工具還有用嗎?▾
有用。平台不能真分流時,正確做法是『前後期對照』——換之前一段時間 vs 換之後一段時間比較。工具會幫你規劃這種對照怎麼做、要控制哪些變因(避開大促、流量來源一致),讓前後比較盡量公平,而不是隨便換了就說有效。
它估的樣本量和天數準嗎?▾
那是基於你提供的流量與轉換做的經驗概算,工具會明確標示『非精確統計檢定』。重點是給你一個合理的跑測量級,避免你樣本太少就下結論。要更精確可以用線上樣本量計算器,但對多數中小賣家來說,這個概算足以判斷『大概要跑一週還是一個月』。
為什麼一直強調『一次只測一個變因』?▾
因為同時改主圖又改價格,就算成績變好,你也分不清是哪個動作的功勞,下次無法複製、也可能其中一個其實在扯後腿。一次測一個變因,結果才能歸因、才能累積成可靠的優化經驗。想改很多項,工具會建議你排成多輪依序測。
我流量很小,可以測按鈕顏色這種小東西嗎?▾
不太建議。差異越小的改動,要分辨出真實效果需要的樣本量越大,小流量賣場可能要跑好幾個月才看得出來,期間市場早就變了。流量小應該先測影響大的東西——主圖、價格、訴求角度,工具也會依你的流量提醒哪些測試不划算。
可以中途看結果嗎?▾
不建議提早判讀。測試早期數字波動很大,偷看一兩天常會看到『假性勝出』然後白忙一場。工具會給你一個停止規則:跑滿規劃的樣本或天數、且主指標明顯勝出才算贏。忍住不偷看,是 A/B 測試最重要的紀律之一。