本來不想浪費時間幫人複習高中數學
但是有鑒於nacle大大氣到寄站內信過來嗆聲
我還是稍微解釋一下為什麼這類關於各抽選因素對抽中超夢券的統計
如果用錯資料抽樣方式很有可能是浪費時間的了
--
(跟主題無關部分恕刪)
起因是原PO有一項推測如下:
: 7. 道館金牌銀牌其實不重要? (抽中的往往是沒獎牌的人)
: 我想大家可以從今天起自己記錄一下, 每一次頭目戰打的地點, 頭目
: , 現場約略人數. 一週之後如果有抽中, 再看看自己的統計資料, 到
: 底是不是跟上面那些因素有關, 還是有其他更相關的因素.
: 或許幾週之後我們大家也可以找到一個規律, 或許最後得到的結論就
: 是純亂數. 但是少是大家實測出來的結果...
之後nacle推文如下:
然後我提出這種統計方法不可能成功得知獎牌對抽選影響與他的回覆:
先複習一下抽樣, 當我們想要透過研究部分個體來推測母群體特性時
這種行為就叫做抽樣
抽樣分為兩大類
隨機抽樣(random sampling) :
以純粹隨機的方式不受任何特定因素影響的抽取樣本, 又稱機率抽樣
ex : 用亂數表選出指定編號的個體進行調查
非隨機抽樣(non-random sampling) :
以特定規則選出欲研究之樣本, 又稱非機率抽樣
ex : 在人多的地方, 例如機場, 訪問過往行人進行問券調查
這樣雖然可以短時間搜集大量資料, 但是受訪對象中常搭飛機的旅客被訪問機率大增
不常搭飛機的人就幾乎沒機會被調查到, 不符合隨機抽樣之不用特定規則挑選樣本的原則
非隨機抽樣因為樣本來源是根據特定條件抽選, 已喪失對母群體特性的代表性
故無法做出有效的統計推論, 較適用於質化研究而非量化研究
--
回到主題, 在PTT上統計資料 "調查各抽選因素(ex:獎牌)對一般玩家抽中超夢券之影響力"
就抽樣上即屬於非隨機抽樣
玩寶可夢的族群中有使用PTT且會逛PMGO板的人口極少
使用PTT之族群大多屬於45歲以下(從站方曾有的使用者年齡統計可推估)
那些佔PMGO玩家不少比例的45歲以上玩家
( https://news.cnyes.com/news/id/3869069 日本統計, 台灣之年齡分佈可能沒差太多)
很大部分不會被此統計調查到其資料
尤其是65歲以上退休人士有錢有閒到處打考古題幾乎被此調查排除在外
這樣以使用PTT且逛PMGO板當作條件選取抽樣架構已造成涵蓋誤差(coverage error)
再者這種問券填答方式依靠對議題有興趣的板友自行填答, 而非隨機抽選玩家回答
會使此調查含有自我選擇偏誤(self-selection bias)
最後, 因為此抽樣方式為非隨機抽樣
我們根本不知道PTT使用族群與每次參與抽選超夢券的全部PMGO玩家之間的機率關係
因此無法用統計學工具估計各種抽樣誤差的影響程度
不管填答率高低
這樣的統計樣本代表性不足、缺乏外部效度, 對了解母群體(所有參與抽券玩家)資料分配
毫無幫助, 充其量只能用來了解 "PTT會逛PMGO板使用者之各抽選有關條件分佈"
想用此推估這些條件對一般玩家取得超夢券之影響力是無效的統計推論
只是浪費大家時間罷了
折衷的一種方式應該是鎖定偏鄉只有1~3個候選道館的cell
當確定下次開獎幾乎必中道館時
有人在現場每場團體戰都統計來打的玩家各項資料分布(全統計或一定比例皆可)
假如該道館不是飛人特別喜愛之標的
這樣就滿足在單座道館"統計資料調查各抽選因素(ex:獎牌)對抽中超夢券之影響力"
的隨機抽樣甚至普查
如果我們假定每座道館都是一樣的抽選機制
再從其中觀察獎牌對抽選的影響力
經過長期統計, 這就真的可以有效了解影響的幅度
國外也真的有人開始做這樣的實驗(但不確定會持續多久)
想要獲得有價值資訊, 用錯誤方式再努力都是緣木求魚
至於
推薦你重讀高中數學, 剛才網路隨便google, 高三數學就有提到我上面說的抽樣方法了
https://goo.gl/fMS9bV
附上連結讓你可以複習一下
最後, 還有一件事:
我不回你另一篇只是因為你開頭都說 : "幻想文,不想浪費時間的人可以先左轉"
因此我真的就不想浪費時間在幻想文上, 不代表你的推論正確我無法反駁
(實際上錯得離譜, 但這不是本篇重點)
先叫別人不喜勿回, 別人真的不回你又說是沒話講
這種阿Q式勝利法真的很讓人可達鴨問號 https://i.imgur.com/M8C2QZA.jpg
我心眼小不小我是不知道啦, 但我至少不會寄站內信嗆聲
附上一個奇怪的科學史小故事就幻想以為打臉什麼的?
你愛在現代人家搭飛機的時代用手黏翅膀試飛是你的自由, 只是會被我這種人笑而已
你覺得OK也歡迎發文自己貼出來你的信讓大家笑笑(礙於站規我不能代勞)
我不像你信裡說的會介意不用客氣喔~
--
古有卡卡西五五開, 今有傳人 xLOVEx 五五波 #1QONTOee (PokemonGO)
--
但是有鑒於nacle大大氣到寄站內信過來嗆聲
我還是稍微解釋一下為什麼這類關於各抽選因素對抽中超夢券的統計
如果用錯資料抽樣方式很有可能是浪費時間的了
--
(跟主題無關部分恕刪)
起因是原PO有一項推測如下:
: 7. 道館金牌銀牌其實不重要? (抽中的往往是沒獎牌的人)
: 我想大家可以從今天起自己記錄一下, 每一次頭目戰打的地點, 頭目
: , 現場約略人數. 一週之後如果有抽中, 再看看自己的統計資料, 到
: 底是不是跟上面那些因素有關, 還是有其他更相關的因素.
: 或許幾週之後我們大家也可以找到一個規律, 或許最後得到的結論就
: 是純亂數. 但是少是大家實測出來的結果...
之後nacle推文如下:
推 nacle: 關於金牌,我抽中的都是同一道館,已金牌。該道館目前出四 01/23 12:14
→ nacle: 次,我抽中三次;其他銀牌以下的抽中率0。給你參考。 01/23 12:14
推 nacle: 獎牌應該是要看個人抽中率,然後比較金牌者跟銅牌者在該道 01/23 12:26
→ nacle: 館的抽中率有沒有差。我提供了我個人的資料,看還有沒有其 01/23 12:26
→ nacle: 他更多的人願意提供數據來比較。你單看某場超夢裡的各種獎 01/23 12:26
→ nacle: 牌人數一定是銅牌最多的,但那不能代表銅牌者抽中率高。 01/23 12:27
然後我提出這種統計方法不可能成功得知獎牌對抽選影響與他的回覆:
→ keith291: 你提供資料沒有用 每次抽選 跟你一起打的玩家不固定 01/23 12:28
→ keith291: 如果這週全部銅牌跟你銀牌抽 跟下一週全部銀牌跟你抽 01/23 12:29
→ keith291: 兩者外在條件已經不一樣 不統計幾乎全部的參加者 01/23 12:29
→ keith291: 無法控制變因比較獎牌差異 這要做實驗要挑偏鄉 01/23 12:30
→ keith291: 可以幾乎統計到每次打過的人才有可能成功完成比較 01/23 12:30
→ keith291: 你在這統計已經排除掉不上ptt路人了 這在市區是多數 01/23 12:43
推 nacle: 這無所謂啊,除非你認為上不上Ptt會影響抽中率 01/23 12:44
→ keith291: ...你該不會以為這個版填答率100%就會有某座一半參加者 01/23 12:49
→ keith291: 問題在使用者少 奇蹟發生100%填答一樣浪費時間 01/23 12:50
→ nacle: 沒聽過抽樣調查嗎? 01/23 12:50
→ nacle: 隨機抽樣調查 隨機抽樣調查 隨機抽樣調查 不懂可以去查書 01/23 12:52
先複習一下抽樣, 當我們想要透過研究部分個體來推測母群體特性時
這種行為就叫做抽樣
抽樣分為兩大類
隨機抽樣(random sampling) :
以純粹隨機的方式不受任何特定因素影響的抽取樣本, 又稱機率抽樣
ex : 用亂數表選出指定編號的個體進行調查
非隨機抽樣(non-random sampling) :
以特定規則選出欲研究之樣本, 又稱非機率抽樣
ex : 在人多的地方, 例如機場, 訪問過往行人進行問券調查
這樣雖然可以短時間搜集大量資料, 但是受訪對象中常搭飛機的旅客被訪問機率大增
不常搭飛機的人就幾乎沒機會被調查到, 不符合隨機抽樣之不用特定規則挑選樣本的原則
非隨機抽樣因為樣本來源是根據特定條件抽選, 已喪失對母群體特性的代表性
故無法做出有效的統計推論, 較適用於質化研究而非量化研究
--
回到主題, 在PTT上統計資料 "調查各抽選因素(ex:獎牌)對一般玩家抽中超夢券之影響力"
就抽樣上即屬於非隨機抽樣
玩寶可夢的族群中有使用PTT且會逛PMGO板的人口極少
使用PTT之族群大多屬於45歲以下(從站方曾有的使用者年齡統計可推估)
那些佔PMGO玩家不少比例的45歲以上玩家
( https://news.cnyes.com/news/id/3869069 日本統計, 台灣之年齡分佈可能沒差太多)
很大部分不會被此統計調查到其資料
尤其是65歲以上退休人士有錢有閒到處打考古題幾乎被此調查排除在外
這樣以使用PTT且逛PMGO板當作條件選取抽樣架構已造成涵蓋誤差(coverage error)
再者這種問券填答方式依靠對議題有興趣的板友自行填答, 而非隨機抽選玩家回答
會使此調查含有自我選擇偏誤(self-selection bias)
最後, 因為此抽樣方式為非隨機抽樣
我們根本不知道PTT使用族群與每次參與抽選超夢券的全部PMGO玩家之間的機率關係
因此無法用統計學工具估計各種抽樣誤差的影響程度
不管填答率高低
這樣的統計樣本代表性不足、缺乏外部效度, 對了解母群體(所有參與抽券玩家)資料分配
毫無幫助, 充其量只能用來了解 "PTT會逛PMGO板使用者之各抽選有關條件分佈"
想用此推估這些條件對一般玩家取得超夢券之影響力是無效的統計推論
只是浪費大家時間罷了
折衷的一種方式應該是鎖定偏鄉只有1~3個候選道館的cell
當確定下次開獎幾乎必中道館時
有人在現場每場團體戰都統計來打的玩家各項資料分布(全統計或一定比例皆可)
假如該道館不是飛人特別喜愛之標的
這樣就滿足在單座道館"統計資料調查各抽選因素(ex:獎牌)對抽中超夢券之影響力"
的隨機抽樣甚至普查
如果我們假定每座道館都是一樣的抽選機制
再從其中觀察獎牌對抽選的影響力
經過長期統計, 這就真的可以有效了解影響的幅度
國外也真的有人開始做這樣的實驗(但不確定會持續多久)
想要獲得有價值資訊, 用錯誤方式再努力都是緣木求魚
至於
→ nacle: 我大學聯考跟學測數學都滿分,不勞您費心 01/23 13:05
推薦你重讀高中數學, 剛才網路隨便google, 高三數學就有提到我上面說的抽樣方法了
https://goo.gl/fMS9bV
附上連結讓你可以複習一下
最後, 還有一件事:
推 nacle: 對啊,我也懷疑是不是另一邊沒話講才在這邊針對我?不過K大 01/23 13:20
→ nacle: 應該不是這麼小心眼的人才對。 01/23 13:20
我不回你另一篇只是因為你開頭都說 : "幻想文,不想浪費時間的人可以先左轉"
因此我真的就不想浪費時間在幻想文上, 不代表你的推論正確我無法反駁
(實際上錯得離譜, 但這不是本篇重點)
先叫別人不喜勿回, 別人真的不回你又說是沒話講
這種阿Q式勝利法真的很讓人可達鴨問號 https://i.imgur.com/M8C2QZA.jpg
我心眼小不小我是不知道啦, 但我至少不會寄站內信嗆聲
附上一個奇怪的科學史小故事就幻想以為打臉什麼的?
你愛在現代人家搭飛機的時代用手黏翅膀試飛是你的自由, 只是會被我這種人笑而已
你覺得OK也歡迎發文自己貼出來你的信讓大家笑笑(礙於站規我不能代勞)
我不像你信裡說的會介意不用客氣喔~
--
→ keith291: 原來黃隊在藍隊多的地方打藍塔就可以50%機會碰到同隊呢 01/19 19:46
→ keith291: 50%大師受教了 01/19 19:47
推 xLOVEx: 出現搶尾刀人數分佈跟一開使去打的顏色比例是一樣的,不是01/19 19:48
→ xLOVEx: 50所以?01/19 19:48
古有卡卡西五五開, 今有傳人 xLOVEx 五五波 #1QONTOee (PokemonGO)
--
All Comments