<thead id="wtvt8"></thead>

      <label id="wtvt8"></label>
        1. <li id="wtvt8"><big id="wtvt8"></big></li><span id="wtvt8"><optgroup id="wtvt8"></optgroup></span>
            国产黑色丝袜在线播放,97视频精品全国免费观看,日韩精品中文字幕有码,在线播放深夜精品三级,免费AV片在线观看网址,福利一区二区在线观看,亚洲深夜精品在线观看,2019亚洲午夜无码天堂

            產品推薦:氣相|液相|光譜|質譜|電化學|元素分析|水分測定儀|樣品前處理|試驗機|培養箱


            化工儀器網>技術中心>其他文章>正文

            歡迎聯系我

            有什么可以幫您? 在線咨詢

            做實驗需要掌握哪些統計學知識?

            來源:湘潭宇科分析儀器有限公司   2025年01月04日 10:45  

            統計學是數據分析的基石。學了統計學,你會發現很多時候的分析并不靠譜。比如很多人都喜歡用平均數去分析一個事物的結果,但是這往往是粗糙的,準確的。如果學了統計學,那么我們就能以更多更科學的角度看待數據。 


            大部分的數據分析,都會用到統計方面的以下知識,可以重點學習:

            • 基本的統計量:均值、中位數、眾數、方差、標準差、百分位數

            • 概率分布:幾何分布、二項分布、泊松分布、正態分布等

            • 總體和樣本:了解基本概念,抽樣的概念

            • 置信區間與假設檢驗:如何進行驗證分析

            • 相關性與回歸分析:一般數據分析的基本模型

            通過基本的統計量,你可以進行更多元化的可視化,以實現更加精細化的數據分析。這個時候也需要你去了解更多的Excel函數來實現基本的計算,或者python、R里面一些對應的可視化方法。

            有了總體和樣本的概念,你就知道在面對大規模數據的時候,怎樣去進行抽樣分析。

            你也可以應用假設檢驗的方法,對一些感性的假設做出更加精確地檢驗。

            利用回歸分析的方法,你可以對未來的一些數據、缺失的數據做基本的預測。

            了解統計學的原理之后,你不一定能夠通過工具實現,那么你需要去對應的找網上找相關的實現方法,也可以看書。先推薦一本非常簡單的:吳喜之-《統計學·從數據到結論》。 

            另外,如何精力允許,請掌握一些主流算法的原理,比如線性回歸、邏輯回歸、決策樹、神經網絡、關聯分析、聚類、協同過濾、隨機森林。再深入一點,還可以掌握文本分析、深度學習、圖像識別等相關的算法。關于這些算法,不僅需要了解其原理,你最好可以流暢地闡述出來,還需要你知曉其在各行業的一些應用場景。如果現階段不是工作剛需,可不作為重點。

            本文算是一個知識點匯總,不做細致展開,讓大家了解統計學有哪幾大塊,每一類分別用于什么樣的分析場景。后面幾篇會以實際案例的方式,細致講講描述性統計、概率分布等。


            知識點匯總:

            1.集中趨勢

            2.變異性

            3.歸一化

            4.正態分布

            5.抽樣分布

            6.估計

            7.假設檢驗

            8.T檢驗


            一、集中趨勢

            圖片


            1.眾數

            出現頻率最高的數;

            2.中位數

            把樣本值排序,分布在最中間的值;

            樣本總數為奇數時,中位數為第(n+1)/2個值;

            樣本總數為偶數時,中位數是第n/2個,第(n/2)+1個值的平均數;

            3.平均數

            所有數的總和除以樣本數量;

            現在大家接觸最多的概念應該是平均數,但有時候,平均數會因為某些極值的出現收到很大影響。舉個小例子,你們班有20人,大家收入差不多,19人都是5000左右,但是有1個同學創業成功了,年入1個億,這時候統計你們班同學收入的“平均數”就是500萬了,這也很好的解釋了,每年各地的平均收入數據出爐,小伙伴們直呼給祖國拖后腿了,那是因為大家收入被平均了,此時,“中位數”更能合理的反映真實的情況;



            二、變異性

            圖片


            1.四分位數

            上面說到了“中位數”,把樣本分成了2部分,再找個這2部分各自的“中位數”,也就把樣本分為了4個部分,其中1/4處的值記為Q1,2/4處的值記為Q2,3/4處的值記為Q3

            2.四分位距 IQR=Q3-Q1

            圖片

            3.異常值

            小于Q1-1.5(IQR)或者大于Q3+1.5(IQR);

            對于異常值,我們在數據處理的環節就要剔除;

            4.方差

            圖片

            5.平方偏差

            方差的算術平方根

            6.貝塞爾矯正:修正樣本方差

            實際在計算方差時,分母要用n-1,而不是樣本數量n。原因在于,比如在高斯分布中,我們抽取一部分的樣本,用樣本的方差表示滿足高斯分布的大樣本數據集的方差。由于樣本主要是落在x=u中心值附近,那么樣本如果用如下公式算方差,那么預測方差一定小于大數據集的方差(因為高斯分布的邊沿抽取的數據也很少)。為了能彌補這方面的缺陷,那么我們把公式的n改為n-1,以此來提高方差的數值,這種方法叫貝塞爾矯正系數。



            三、歸一化

            圖片


            1.標準分數

            一個給定分數 距離 平均數 多少個標準差?

            標準分數是一種可以看出某分數在分布中相對位置的方法。

            標準分數能夠真實的反映一個分數距離平均數的相對標準距離。

            圖片


            四、正態分布

            圖片



            1.定義:隨機變量X服從一個數學期望為μ,方差為σ?2;的正態分布,記為N(μ,σ?2;)

            隨機取一個樣本,有68.3%的概率位于距離均值μ有1個標準差σ內;

            有95.4%的概率位于距離均值μ有2個標準差σ內;

            有99.7%的概率位于距離均值μ有3個標準差σ內;

            圖片


            五、抽樣分布

            圖片


            1.中心極限定理

            設從均值為μ,方差為σ?2;的任意一個總體中抽取樣本量為n的樣本,當n充分大時,樣本均值的抽樣分布近似服從均值為μ、方差為σ?2;/n的正態分布

            2.抽樣分布

            設總體共有N個元素,從中隨機抽取一個容量為n的樣本,在重置抽樣時,共有N·n種抽法,即可以組成N·n不同的樣本,在不重復抽樣時,共有N·n個可能的樣本。每一個樣本都可以計算出一個均值,這些所有可能的抽樣均值形成的分布就是樣本均值的分布。但現實中不可能將所有的樣本都抽取出來,因此,樣本均值的概率分布實際上是一種理論分布。數理統計學的相關定理已經證明:在重置抽樣時,樣本均值的方差為總體方差的1/n。

            舉個例子:

            48盆MM豆,計算出每盆有幾個藍色的MM豆,48個數據構成了總體樣本。然后隨機選擇五盆,計算五盆中含有藍色MM豆的平均數,然后反復進行了50次。這就是n為5的樣本均值抽樣。

            圖片


            六、估計

            圖片


            1. 誤差界限

            圖片

            2. 置信度

            We are some % sure the true population parameter falls within a specific range

            我們有百分之多少確信總體中的值落在一個特定范圍內;

            一般情況下,取95%的置信度就可以;

            3. 置信區間

            圖片


            七、假設檢驗

            圖片

            1.問題:什么是顯著性水平?

            顯著性水平是估計總體參數落在某一區間內,可能犯錯誤的概率,也就是Type I Error

            A Type II Error is when you fail to reject the null when it is actually false.

            圖片

            圖片

            2. 如何選擇備選檢驗和零假設?

            一個研究者想證明自己的研究結論是正確的,備擇假設的方向就要與想要證明其正確性的方向一致;

            同時將研究者想收集證據證明其不正確的假設作為原假設H0


            八、T檢驗

            圖片


            1. 主要用于樣本含量較小(例如n<30),總體標準差σ未知的正態分布。

            流程如下:

            圖片

            是用t分布理論來推論差異發生的概率,從而比較兩個平均數的差異是否顯著;

            一般檢驗水準α取0.05即可;

            計算檢驗統計量的方法根據樣本形式不同;

            2. 獨立樣本T檢驗:

            現在要分析男生和女生的身高是否相同兩者的主要區別在于數據的來源和要分析的問題。

            圖片

            問題:為什么T檢驗查表時候要n-1?

            樣本均值替代總體均值損失了一個自由度

            3. 配對樣本t檢驗

            分析人的早晨和晚上的身高是否不同,于是找來一撥人測他們早上和晚上的身高,這里每個人就有兩個值,這里出現了配對

            圖片

            樣本誤差(Standard Error)

            圖片


            圖片

            4. Pooled variance 合并方差

            當樣本平均數不一樣,但實際上認為他們的方差是一樣的時候,需要合并方差

            不要被公式嚇到,他的本質是兩個樣本方差加權平均

            圖片


            圖片

            5. Cohen’s d

            效應量(effect size):提示組間真正的差異占統計學差異的比例,值越大,組間差異越可靠。

            圖片

            圖片


            免責聲明

            • 凡本網注明“來源:化工儀器網”的所有作品,均為浙江興旺寶明通網絡有限公司-化工儀器網合法擁有版權或有權使用的作品,未經本網授權不得轉載、摘編或利用其它方式使用上述作品。已經本網授權使用作品的,應在授權范圍內使用,并注明“來源:化工儀器網”。違反上述聲明者,本網將追究其相關法律責任。
            • 本網轉載并注明自其他來源(非化工儀器網)的作品,目的在于傳遞更多信息,并不代表本網贊同其觀點和對其真實性負責,不承擔此類作品侵權行為的直接責任及連帶責任。其他媒體、網站或個人從本網轉載時,必須保留本網注明的作品第一來源,并自負版權等法律責任。
            • 如涉及作品內容、版權等問題,請在作品發表之日起一周內與本網聯系,否則視為放棄相關權利。
            企業未開通此功能
            詳詢客服 : 0571-87858618
            主站蜘蛛池模板: 亚洲第一黄色网址| 国产成人a在线观看视频免费| 亚洲精品欧美重口| 乱系列中文字幕在线视频 | 男人狂桶女人出白浆免费视频| 国产成人人综合亚洲欧美丁香花| 综合偷自拍亚洲乱中文字幕| 午夜福利精品国产二区| 久久毛片基地| 国产午夜福利在线视频| 亚洲爆乳WWW无码专区| 午夜啪啪福利| 欧美日韩精品一区二区三区高清视频 | 亚洲精品男男一区二区| 激情视频综合网| 人妻一区二区三区三区| 日韩欧美国产成人| 欧美一本大道香蕉综合视频| a在线亚洲男人的天堂试看| 国产主播喷水| 波多野衣结在线精品二区| 制服 丝袜 亚洲 中文 综合| 翘臀少妇被扒开屁股日出水爆乳| 日本久久网站| 无码日韩做暖暖大全免费不卡| 国产H片无码不卡在线视频| 国产成人8X人网站视频| 97午夜理论电影影院| 国产一区在线观看无码| 欧美激情一区二区三区成人 | 国内精品无码一区二区三区| 久久香蕉国产线| 日韩在线观看精品亚洲| 99RE8这里有精品热视频| 国产一区二区三区免费观看| 99精品热在线在线观看视| 婷婷色婷婷| 亚洲国产精品一区二区第一页免 | 久久这里只有精品2| 东京热一区二区三区无码视频| www亚洲精品|