Posted in Neumonews (2008)
Pagpapakilala
Sa maraming okasyon, kailangan naming pag-aralan ang mga relasyon ng pag-asa o pagsasarili sa pagitan ng dalawang variable ng husay o pasubali. Ang mga variable ay tinatawag din na mga kadahilanan, habang ang iba't-ibang mga kategorya ng mga variable ay madalas na sinasangguni na antas. May mga iba't-ibang pagsusulit upang sukatin ang pagtitiwala sa pagitan ng dalawang variable ng husay, kasama ang Chi-square sa kanyang iba't-ibang mga bersyon. Sa kabanata na ito suriin namin ang mga statistical pagsusulit na karaniwang ginagamit sa biomedical pananaliksik sa krus pasubali mga variable at mga halimbawa upang mapadali ang pag-unawa.
Ipalagay na ang isang pag-aaral sa 45 mga pasyente sa kung saan nais namin sa pag-aaral ng kaugnayan sa pagitan ng paninigarilyo at paggamit ng COPD spirometry diagnosed na makuha ang mga resulta sa Table I. Maaari naming makita na 15 ng 25 pasyente (60%) ay COPD sa loob ng grupo ng mga smokers, habang lamang 5 ng 20 (25%) ay COPD sa grupo ng mga nonsmokers. Mula sa isang clinical paninindigan sa mga pagkakaiba ay mahalaga, ngunit ito ay mula sa isang statistical point ng tingnan?
Table I. Relasyon sa pagitan ng COPD at paninigarilyo. Napagmasdang frequency at haligi percentage.
| Smoker | |||
| COPD | Hindi | Oo | Total |
| Hindi | 15 (75%) | 10 (40%) | 25 (55.6%) |
| Oo | 5 (25%) | 15 (60%) | 20 (44,4%) |
| Total | 20 (100%) | 25 (100%) | 45 (100%) |
Chi-square (X 2)
Ang chi-square test ng Pearson (X 2) ay isa sa mga pinaka-karaniwang ginagamit sa larangan ng medisina at biology. pagsubok na ito ay hindi masukat ang antas ng lakas o ng mga samahan sa pagitan ng dalawang tiyak na mga variable ng mga panukala na mayroon na bilang ng mga logro ratio o kamag-anak panganib, na para sa mga layunin. unang-una ito ay ginagamit sa pag-aaral ang pagsasamahan sa pagitan ng dalawang variable pasubali o ng husay at para sa mga paghahambing ng sukat o percentage. Paggamit nito ay hindi restricted lang para sa dichotomous variable. Kung ang isa sa dalawang variable ay Ordinal ng kalikasan, mag-aplay ang Chi-square para sa guhit takbo bilang tinalakay sa ibaba.
Maaari din naming mahanap ito sa ilalim ng pangalan na "chi-square", at pagsasalin nito sa Castilian pinanggalingan ng Ingles ang salitang "chi-squared." Dahil ang pangalan sa Castilian para sa Griyego sulat ay X "ji", ginagamit namin na ang pangalan. X 2 test maaaring maipataw sa isang variable na ihambing sa inaasahang halaga sundin, bagaman ang kanyang pinaka-madalas na gamitin ay upang ihambing ang dalawang sukat. Isa sa mga limitasyon nito ay na ito ay nangangailangan ng isang malaking sample ng sapat na laki, at bagaman nito pagkalkula ay simple, hindi kaya marami upang maunawaan ang kanyang pinanggalingan at ang kanyang interpretasyon. Basta sabihin na ang mga halaga ng chi-square estadiskita sa isang antas ng kalayaan ay tumutugma sa mga nakuha sa isang mataas na pamantayan normal na pamamahagi sa parisukat, at sa gayon ang Chi-square ay isa lamang sa pila lamang sa pagkakaroon ng positibong mga halaga.
Ang pagpapahayag ng Chi-square ay:
| | Obs: sundin frequency. Eng: inaasahan frequency. |
Sa aming mga halimbawa sa Table ko may dumating sa kabila ng husay ng dalawang variable COPD at smokers na may dalawang kategorya ng bawat isa. Hindi kasama ang kabuuang mga cell (na tinatawag na nasa gilid) ay nagbibigay ng isang talaan ng mga hilera ng dalawang sa pamamagitan ng dalawang haligi. Kapag alam mo ang kabuuan para sa bawat kategorya, kung alam namin ang dalas ng isang cell, ito ay madaling pagbatayan ang mga frequency ng iba. Kaya ito ay sinabi na kami ay may isang antas ng kalayaan, na kilala bilang nasa gilid, kami lamang magkaroon ng "kalayaan" upang itakda ang halaga sa isang cell, dahil ang iba at ay ipataw sa pamamagitan ng ang data. Para sa mga talahanayan ng mga hilera n at m mga haligi, ang mga degree ng kalayaan ay kinakalkula bilang (n - 1) x (m - 1). Sa halimbawa, kung alam namin na may mga 15 smokers na may COPD, na kilala nasa gilid frequency ay madaling upang makumpleto ang mga natitirang ng talahanayan. Namin kaya isa lamang na antas ng kalayaan.
Ang aming null ipotesis (H o) ay ipinahayag na ang proporsyon ng mga pasyente na may COPD ay ang parehong sa grupo ng mga smokers kaysa sa nonsmokers. Ang aming mga alternatibong teorya (H 1), sa pamamagitan ng kaibahan, magtaltalan na ang mga sukat ay naiiba. Kung ang ratio ay iba, isaalang-alang namin ang dalawang posibilidad: na ang proporsyon ng mga pasyente na may COPD ay mas mataas o mas mababa sa smokers, kaya ang mga pagsubok ay tinatawag din na ang mga bilateral o "dalawang krus."
Kung ang mga pagkalkula ng mga halaga ng expression X 2, na kung saan ay ang pagkakaiba sa pagitan ng sundin at inaasahan, dumaan sa isang tiyak na kritikal na halaga, sabihin natin na ang pagkakaiba ay masyadong malaki na ipinaliwanag sa pamamagitan ng pagkakataon. Kung sa aming pag-aaral 20 pasyente na may COPD ay may 45 mga tao (44%), kaya na ang mga null teorya ay totoo, dapat na namin ang parehong proporsyon ng mga pasyente na may COPD sa smokers at nonsmokers. Iyon ay, ang 25 smokers, inaasahan namin na magkaroon ng (25 * 20) / 45 na paninigarilyo ay humigit-kumulang sa 11. Kaya kami ay makakuha ng mga inaasahan na frequency para sa natitirang tatlong cells (Table II). Kapag alam namin ang mga inaasahang mga frequency, maaari lamang namin makalkula ang halaga ng expression X 2 ay isang simpleng kabuuan ng squared pagkakaiba:
Table II. Relasyon sa pagitan ng COPD at paninigarilyo. Inaasahang frequency.
| Smoker | |||
| COPD | Hindi | Oo | Total |
| Hindi | 11.1 (55.6%) | 13.9 (55.6%) | 25 (55.6%) |
| Oo | 8.9 (44.4%) | 11.1 (44.4%) | 20 (44.4%) |
| Total | 20 | 25 | 45 |
Kung ang hitsura namin sa mga talahanayan ng chi-square pamamahagi para sa isang antas ng kalayaan, maaari naming makita na ang mga statistical kabuluhan p <= 0.05, ay nakamit para sa mga halaga ng X 2 pantay-pantay sa o mas malaki kaysa sa 3.84. Bilang ang halaga ng nakuha sa aming pag-aaral, 5.51 ay mas malaki kaysa sa kritikal na halaga ng 3.84, tanggihan namin ang null ipotesis (H 0) at natagpuan na ang pagkakaiba ay maaaring bahagya ay ipinaliwanag sa pamamagitan ng pagkakataon, ang isang mas mataas na proporsyon ng mga pasyente COPD sa smokers (p <0.05). Bilang ay makikita, ang halaga ng chi-square estadiskita ay hindi pagbabago sa magpalitan ang mga hanay at haligi. Kung pagpapabalik namin ang ilang mga standard normal na pamamahagi (ibig sabihin ng 0 at standard na paglihis 1), sa pagitan ng (-1.96, +1,96) nangongolekta ng 95% ng probabilidad, Aalis lamang ng 5% out. Tiyak (1.96) 2 ay 3.84. Kung ikaw ay may isang computer o sa kawalan ng isang talahanayan na may halaga p ng X 2, nakita namin na ang p halaga na kaugnay sa X 2 = 5.51 sa isang antas ng kalayaan ay p = .019.
Upang matagumpay na mag-aplay ang Chi-square, hindi bababa sa 80% ng mga cell ay dapat magkaroon ng inaasahang dalas ng mas higit sa 5. Kung ito ay hindi tunay na, kami ay laging may humingi ng tulong sa mga kategorya ng grupo maliban na lamang kung ang aming mga mesa ay 2 × 2 (dalawang dichotomous variable), kung saan ang kaso ginamit namin eksaktong pagsubok Fisher's.
Kung minsan ang isang pagbabago ay nagpasimula sa pagkalkula ng mga kataga ng X 2, na tinatawag na Yates pagtutuwid o pagtutuwid para sa pagpapatuloy, at sa mga minimal na epekto sa mga malalaking mga halimbawa. Ang resulta ng kanilang pagpapatupad ay isang pagbabawas ng pangwakas na halaga ng chi-square, at sa gayon ito ay gumagawa ng kaunti pa sa konserbatibo. Kahit na walang kasunduan sa panitikan tungkol sa paggamit nito, ang paggamit nito ay dahil sa ang katunayan na ang paminsan-minsan maging sa bilang variable ay dichotomized sa isang araw ng katapusan.
Iba pang mga pagsusuri ng teorya pagsubok sa pagitan ng mga variable ng pasubali
Ang isang baryante ng Pearson X 2 pagsubok na subukan ang mga teorya ng pagsasarili sa pagitan ng pasubali variable ay ang posibilidad ratio chi-square. Hindi tulad ng Pearson chi-square, sa pagsubok na ito ay batay sa na ang ratio ng logarithms ng sundin at inaasahang frequency.
Mayroong isang bilang ng mga hakbang na kung saan maaari naming sukatin ang antas ng samahan sa pagitan ng mga variable pasubali bukod sa mga kilala na kamag-anak at mga panganib logro ratios. Kabilang sa mga set ng mga pagsusulit na masukat ang antas ng pagtitiwala sa pagitan ng mga variable ng pasubali ay maliit na kawalang-tiyak ng anumang mangyayari koepisyent, Cramer's V, ang timbang at walang simetrya Lambdas at ang coefficients ng proporsyonado at walang simetrya kawalang-katiyakan. Sa pangkalahatan, ang lahat ng mga pagsusulit (maliban ang koepisyent ng kawalang-tiyak ng anumang mangyayari mesa mas malaki kaysa sa 2 × 2) tumatagal ng mga halaga sa loob ng isang hanay ng 0-1, na kung saan ang 0 ay hindi magpahiwatig ng samahan sa pagitan ng mga variable at 1, isang malakas na pagsasamahan. Lahat ng mga pagsusulit ay matatagpuan sa statistical pakete tulad ng SPSS.
Maaari mo ring manggaling sa ilang point ang kailangan sa krus dalawang tiyakan mga variable na may sariling katangian na ang isa ay Ordinal. Ipagpalagay na nais namin na ang cross singhutin consumption sinusukat sa tatlong kategorya: non-smoker, katamtaman smoker, paninigarilyo mataas na may COPD (Table III). Maaari naming makita ang malinaw na ang proporsyon ng mga pasyente na may COPD ay nagdaragdag sa consumption ng pag-amoy.
Table III. Relasyon sa pagitan ng COPD at paninigarilyo.
| Paghitid | ||||
| COPD | Non-smoker | Katamtaman | Mataas | Total |
| Hindi | 23 (76,7) | 19 (63.3) | 15 (50.0) | 57 (63.3%) |
| Oo | 7 (23.3) | 11 (36,7) | 15 (50.0) | 33 (36.7%) |
| Total | 30 (100%) | 30 (100%) | 30 (100%) | 90 (100%) |
Kung calculásemos sa halimbawang ito ang chi-square estadiskita ay kumuha ng isang halaga ng 4.60 at p = 0.111 (dalawang degree ng kalayaan). halaga na ito ay ang parehong alintana ng kung paano namin inayos ang mga kategorya ng pag-amoy consumption. Sa pagkalkula ng mga Pearson X 2 pagsubok ay hindi tumagal sa account ang mga order ng mga kategorya at sa gayon ay mawalan ng mahalagang impormasyon. Ang pagsubok 2 X para sa guhit lakad, laging may isang antas ng kalayaan, at kabilang ang isang pagbabago sa pagkalkula tungkol sa pagpapahayag ng Chi-square Pearson, kaya kumuha kami sa account na ang pagkakasunod-sunod ng mga kategorya. Sa aming mga halimbawa sa Table III, ang p-halaga ay 0.033, na nagpapahiwatig na ang bilang ay nagdaragdag singhutin consumption, kaya ang ang porsyento ng mga pasyente na may COPD.
Ang parehong mga problema ay maaaring may been nalutas sa pamamagitan ng di-parametric Mann-Whitney U, at nagbibigay-daan din ang paghahambing ng dalawang mga Ordinal variable.
Kung cross namin Ordinal dalawang variable sa pag-aaral ng kaugnayan ng dependency, gagamitin namin ang ugnayan koepisyent Spearman nonparametric, ngunit kami ay mayroon ding iba pang paraan ng samahan para sa Ordinal variable, tulad ng Gamma, Kendall's Tau-b, Kendall's Tau-C at D Somers. Ang interpretasyon ng mga coefficients ay katulad sa lahat ng mga ito, pagkuha ng mga halaga sa pagitan ng -1 at 1. Halaga malapit sa 1 ay nagpapahiwatig ng isang malakas na positibong asosasyon, ibig sabihin, sa pagtaas ng halaga ng isang variable, upang gawin ang iba pang mga. Sa laban, mga halaga ng malapit sa -1 nagpapahiwatig ng isang malakas na negatibong kapisanan, at sa gayon ay may pagtaas ng halaga ng isang variable, bumaba ang iba pang mga. Sa halimbawa sa Table IV, na sumusukat sa antas at direksyon ng samahan sa pagitan ng paninigarilyo at kalubhaan ng COPD, kapag kinakalkula ang halaga ng Gamma makakuha ng isang resulta ng 0.718, na nagpapahiwatig ng isang malakas na positibong asosasyon sa pagitan ng variable. Marami sa mga kadahilanang ito ay kasama sa statistical mga programa tulad ng SPSS o SAS.
Table IV. Ugnayan sa pagitan ng kalubhaan ng COPD at paninigarilyo,
| Paghitid | ||||
| COPD | Non-smoker | Katamtaman | Mataas | Total |
| Mahinahon | 20 (66.7%) | 8 (26.7%) | 2 (6.7%) | 30 (33.3%) |
| Katamtaman | 8 (26.7%) | 10 (33.3%) | 8 (26.7%) | 26 (28.9%) |
| Malubha | 2 (6.7%) | 12 (40.0%) | 20 (66.7%) | 34 (37.8%) |
| Total | 30 (100%) | 30 (100%) | 30 (100%) | 90 (100%) |
Panghuli pinapayo namin sa karagdagang pagbabasa espesyalista mambabasa na maunawaan ang mga kadahilanan, dahil ayon sa konteksto at kalagayan ay maaaring higit na mabuti sa bawat isa.
Biblyograpya
1 Ferrán Aranaz, M. (1996). SPSS para sa Windows. Programming at statistical analysis. Kawalang-tiyak ng anumang mangyayari mesa at mga panukala ng kapisanan. McGraw-Hill.
2 Miller, LM (2004). http://seh-lelha.org/stat1.htm. Association of nominal at Ordinal ng husay variable. (Lift Engineering).
3 Pita Fernández, S. at S. Pertegás Diaz (2004). http://www.Fisterra.com. Association ng mga variable ng husay: chi-square test. Walang hiya Aten Primaria.
4 Martínez González, MA, Jokin de Irala at Fajardo Faulín FJ (2001). Friendly Biostatistics. Ed: Díaz de Santos.







