Obsah:
- Bayesova veta
- 1. Podmienené pravdepodobnosti a Bayesova veta
- 2. Špeciálne formy Bayesovej vety
- 3. Úloha Bayesovej vety v subjektivistických účtoch dôkazov
- 4. Úloha Bayesovej vety v subjektivistických modeloch učenia
- Bibliografia
- Akademické nástroje
- Ďalšie internetové zdroje

Video: Bayesova Veta

2023 Autor: Noah Black | [email protected]. Naposledy zmenené: 2023-08-25 04:39
Vstupná navigácia
- Obsah vstupu
- Bibliografia
- Akademické nástroje
- Náhľad priateľov PDF
- Informácie o autorovi a citácii
- Späť na začiatok
Bayesova veta
Prvýkrát publikované 28. júna 2003; podstatná revízia Ut 30. septembra 2003
Bayesova veta je jednoduchý matematický vzorec používaný na výpočet podmienených pravdepodobností. Má významné postavenie v subjektivistických alebo bayesovských prístupoch k epistemológii, štatistike a indukčnej logike. Subjektivisti, ktorí tvrdia, že racionálna viera sa riadi zákonmi pravdepodobnosti, sa vo svojich teóriách dôkazov a svojich modeloch empirického učenia silne opierajú o podmienené pravdepodobnosti. Bayesova veta je pre tieto podniky kľúčová, pretože zjednodušuje výpočet podmienených pravdepodobností a objasňuje významné znaky subjektivistického postavenia. Skutočné ústredné chápanie vety - v skutočnosti, že hypotéza je potvrdená akýmkoľvek súborom údajov, ktoré jej pravda umožňuje - je základným kameňom každej subjektivistickej metodológie.
- 1. Podmienené pravdepodobnosti a Bayesova veta
- 2. Špeciálne formy Bayesovej vety
- 3. Úloha Bayesovej vety v subjektivistických účtoch dôkazov
- 4. Úloha Bayesovej vety v subjektivistických modeloch učenia
- Bibliografia
- Akademické nástroje
- Ďalšie internetové zdroje
- Súvisiace záznamy
1. Podmienené pravdepodobnosti a Bayesova veta
Pravdepodobnosť hypotézy H podmienená daným súborom dát E je pomer bezpodmienečnej pravdepodobnosti spojenia hypotézy s údajmi k bezpodmienečnej pravdepodobnosti samotných údajov.
(1.1) | Definícia. |
Pravdepodobnosť H podmienená E je definovaná ako P E (H) = P (H & E) / P (E) za predpokladu, že existujú obidva podmienky tohto pomeru a P (E)> 0. [1] |
Na ilustráciu predpokladajme, že J. Doe je náhodne vybraný Američan, ktorý žil 1. januára 2000. Podľa Centra pre kontrolu chorôb Spojených štátov zomrelo v kalendárnom roku 2000 približne 2,4 milióna z 275 miliónov Američanov nažive v ten deň. Z približne 16,6 milióna starších občanov (vo veku 75 rokov a viac) zomrelo približne 1,36 milióna. Bezpodmienečná pravdepodobnosť hypotézy, že náš J. Doe zomrel v roku 2000, H, je iba miera úmrtnosti P (H) = 2,4 M / 275 M = 0,00873. Aby sme našli pravdepodobnosť smrti J. Doeho na základe informácií, E, že on alebo ona bola seniorom, delíme pravdepodobnosť, že on alebo ona je seniorom, ktorý zomrel, P (H & E) = 1,36M / 275M = 0,00495 pravdepodobnosťou, že bol starším občanom, P (E) = 16,6 M / 275 M = 0,06036. Pravdepodobnosť úmrtia J. Doeho preto, že bol starší, je P E (H) = P (H & E) / P (E) = 0,00495 / 0,06036 = 0,082. Všimnite si, ako veľkosť celkovej populácie ovplyvňuje túto rovnicu, takže P E (H) je iba pomer starších ľudí, ktorí zomreli. Je potrebné porovnať toto množstvo, ktoré poskytuje úmrtnosť seniorov, s "inverzný" pravdepodobnosti E podmienené o H, P H (E) = P (H & E) / P (H) = 0,00495 / 0,00873 = 0,57, čo je podiel úmrtí na celkovej populácii, ku ktorej došlo u seniorov.
Tu sú niektoré priame následky (1.1):
- Pravdepodobnosť. P E je pravdepodobnostná funkcia. [2]
- Logické následky. Ak E znamená H, potom P E (H) = 1.
- Zachovanie istôt. Ak P (H) = 1, potom P E (H) = 1.
- Miešanie. P (H) = P (E) P E (H) + P (~ E) P ~ E (H). [3]
Najdôležitejšou skutočnosťou o podmienených pravdepodobnostiach je bezpochyby Bayesova veta, ktorej význam prvýkrát ocenil britský duchovný Thomas Bayes vo svojej posmrtne publikovanej tvorbe „Esej k riešeniu problému v doktríne šancí“(Bayes 1764). Veta Bayesův vzťahuje na, priame 'pravdepodobnosť hypotézy podmienené daného útvaru dát, P E (H), na, inverzný' pravdepodobnosti dát podmienené hypotézy, P H (E).
(1.2) | Bayesova veta. |
P E (H) = [ P (H) / P (E)] P H (E) |
V nešťastné, ale teraz nevyhnutné, výberu terminológie, štatistici pozri inverzné pravdepodobnosti P H (E) ako "pravdepodobnosti" H na E. Vyjadruje, do akej miery hypotéza predpovedá údaje uvedené základné informácie kódované v pravdepodobnosti P.
Vo vyššie uvedenom príklade je podmienka, že J. Doe zomrel v roku 2000, pomerne silným prediktorom vyššieho občianstva. Naozaj, rovnica P H (E) = 0,57 nám hovorí, že 57% z celkového počtu úmrtí došlo u seniorov, že rok. Bayesova veta nám umožňuje použiť tieto informácie na vypočítanie „priamej“pravdepodobnosti úmrtia J. Doea vzhľadom na to, že bol starším občanom. My to vynásobením "predpovedanie termín" P H (E) ako pomer celkového počtu úmrtí v populácii k počtu seniorov v populácii, P (H) / P (E) = 2,4 milióna / 16,6 M = 0,144. Výsledkom je P E (H) = 0,57 × 0,144 = 0,082, presne podľa očakávania.
Hoci je matematická trivialita Bayesova veta, má pri výpočte podmienených pravdepodobností veľkú hodnotu, pretože inverzné pravdepodobnosti sa zvyčajne ľahšie zisťujú a menej subjektívne ako priame pravdepodobnosti. Ľudia s rôznymi názormi na bezpodmienečné pravdepodobnosti E a H často nesúhlasia s hodnotou E ako ukazovateľom H. Napriek tomu sa môžu dohodnúť na miere, do akej hypotéza predpovedá údaje, ak vedia o niektorej z nasledujúcich intersubjektívne dostupných faktov: a) objektívna pravdepodobnosť E vzhľadom na H, b) frekvencia výskytu udalostí ako E ak H je pravda, alebo (c) skutočnosť, že H logicky znamená E. Vedci často navrhujú experimenty tak, aby pravdepodobnosť bola známa jedným z týchto „objektívnych“spôsobov. Bayes 'Veta potom zaisťuje, že akýkoľvek spor o význame experimentálnych výsledkov sa dá vysledovať ako „subjektívne“nezhody o bezpodmienečných pravdepodobnostiach H a E.
Keď obaja P H (E) a P ~ H (E), sú známe ako experimentátor ani nemusí vedieť, E je pravdepodobnosť, aby bolo možné stanoviť hodnotu P E (H) pomocou Bayesova veta.
(1.3) | Bayesova veta (2. forma). [4] |
P E (H) = P (H) P H (E) / [ P (H) P H (E) + P (+ H) P ~ H (E)] |
V tomto prípade je Bayesova veta obzvlášť užitočná na odvodenie príčin ich účinkov, pretože je často pomerne ľahké rozlíšiť pravdepodobnosť účinku vzhľadom na prítomnosť alebo neprítomnosť domnelej príčiny. Napríklad lekári často vyhľadávajú choroby so známou prevalenciou pomocou diagnostických testov rozpoznávanej citlivosti a špecifickosti. Citlivosť testu, jeho „skutočná pozitívna“frekvencia, je zlomok, v akom pre neho pacienti s chorobou testujú pozitívny výsledok. Špecifickosť testu, jeho „skutočná negatívna“miera, je podiel zdravých pacientov, ktorí testujú negatívne. Ak necháme H byť udalosťou daného pacienta, ktorý má ochorenie, a E bude udalosťou pozitívneho testovania tohto ochorenia, potom test „s Citlivosť a špecifickosť sú dané pravdepodobnosťou P H (E) a P~ H (~ E), v tomto poradí, a "základné" prevalencie ochorení v populácii je P (H). Vzhľadom na tieto vstupy týkajúce sa účinkov choroby na výsledok testu sa dá použiť (1.3) na stanovenie pravdepodobnosti ochorenia pri pozitívnom teste. Podrobnejšia ukážka tohto procesu je uvedená v príklade 1 doplnkového dokumentu „Príklady, tabuľky a nákresy“.
2. Špeciálne formy Bayesovej vety
Bayesova veta sa dá vyjadriť rôznymi formami, ktoré sú užitočné na rôzne účely. Jedna verzia používa to, čo Rudolf Carnap nazýval relevantným kvocientom alebo pravdepodobnostným pomerom (Carnap 1962, 466). Je to faktor PR (H, E) = P E (H) / P (H), ktorým sa musí bezpodmienečná pravdepodobnosť H vynásobiť, aby sa jeho pravdepodobnosť podmienila E. Bayesova veta je ekvivalentom jednoduchého princípu symetrie pravdepodobnostných pomerov.
(1.4) | Pravidlo pravdepodobnostného pomeru. |
PR (H, E) = PR (E, H) |
Pojem napravo predstavuje jednu mieru miery, do akej H predpovedá E. Ak považujeme P (e), exprimujúce "základný" predvídateľnosť E dané informácie o pozadí kodifikovali P, a P, H (E), ako je predvídateľnosti E je, keď H sa pridá k tejto situácii, potom PR (E, H) zachytáva stupeň, do ktorého poznanie H robí E viac alebo menej predvídateľným vzhľadom na základnú líniu: PR (E, H) = 0 znamená, že H kategoricky predpovedá ~ E; PR (E, H) = 1 znamená, že pridanie H vôbec nezmení predikciu základnej línie; PR (E, H) = 1 / P (E) znamená, že H kategoricky predpovedá E. Pretože P(E)) = P T (E)), kde T je akákoľvek pravda o logike, môžeme si myslieť (1.4), že nám hovorí, že
Pravdepodobnosť hypotézy podmienenej na súbore údajov sa rovná bezpodmienečnej pravdepodobnosti hypotézy znásobenej stupňom, do ktorého hypotéza prekračuje tautológiu ako prediktor údajov.
V našom príklade J. Doe je PR (H, E) získaná porovnaním predvídateľnosti postavenia nadriadeného, vzhľadom na to, že J. Doe zomrel v roku 2000 s jeho predvídateľnosťou, pričom neboli poskytnuté žiadne informácie o jeho úmrtnosti. Delenie bývalého "predpovedanie termín" od druhých výnosov PR (H, E) = P H (E) / P (E) = 0,57 / 9,44 = 0.06036. Ako prediktorka postavenia senior v roku 2000 je teda vedomie, že J. Doe zomrel, viac ako deväťkrát lepšie ako nevedenie, či žila alebo zomrela.
Ďalšou užitočnou formou Bayesovej vety je Pravidlo Kurzov. V žargóne bookmakerov je „pravdepodobnosť“hypotézy pravdepodobnosť delená pravdepodobnosťou jej negácie: O (H) = P (H) / P (~ H). Tak napríklad, dostihový kôň, ktorého šance na výhru konkrétny závod je 7-to-5 má 7 / 12 šancu na výhru a 5 / 12 pravdepodobnosť straty. Aby sme porozumeli rozdielu medzi pravdepodobnosťou a pravdepodobnosťou, pomáha uvažovať o pravdepodobnosti ako o zlomkoch vzdialenosti medzi pravdepodobnosťou rozporu a pravdepodobnosťou tautológie, takže P (H) = p znamená, že H je p krát pravdepodobnejšie ako pravdivé ako tautológia. Naopak, písanie O (H) = [ P(H) - P (F)] / [ P (T) - P (H)] (kde F je nejaký logický rozpor) je zrejmé, že O (H) vyjadruje rovnaké množstvo ako pomer množstva, o ktoré H pravdepodobnosť presahuje pravdepodobnosť rozporu s výškou, o ktorú je prekročená pravdepodobnosťou tautológie. Rozdiel medzi „pravdepodobnostnou rečou“a „pravdepodobnou rečou“teda zodpovedá rozdielu medzi slovami „sme dve tretiny cesty“a „slovami„ sme zašli dvakrát tak ďaleko, ako ešte musíme ísť “.
Analóg pravdepodobnostného pomeru je pravdepodobnostný pomer OR (H, E) = O E (H) / O (H), faktor, ktorým sa musia bezpodmienečné kurzy H vynásobiť, aby sa dosiahla jeho pravdepodobnosť podmienená E. Bayesova veta je ekvivalentom nasledujúcej skutočnosti o pomeroch šancí:
(1.5) | Pravidlo pomeru kurzov. |
Alebo (H, E) = P H (E) / P ~ H (E) |
Všimnite si podobnosť medzi (1.4) a (1.5). Aj keď každý používa iný spôsob vyjadrenia pravdepodobnosti, každý ukazuje, ako možno dosiahnuť jeho vyjadrenie pre pravdepodobnosť H podmienenú E, vynásobením jeho vyjadrenia pre bezpodmienečnú pravdepodobnosť H faktorom zahŕňajúcim inverzné pravdepodobnosti.
Množstvo LR (H, E) = P H (E) / P ~ H (E), ktorý sa objavuje v (1.5) je pomer pravdepodobnosť H vzhľadom k tomu, E. V testovacích situáciách, ako je situácia opísaná v príklade 1, je pravdepodobnostný pomer skutočnou pozitívnou rýchlosťou testu delenou jeho chybnou pozitívnou rýchlosťou: LR = citlivosť / (1 - špecifickosť). Rovnako ako v prípade pravdepodobnostného pomeru môžeme pravdepodobnostný pomer konštruovať ako mieru stupňa, do ktorého H predpovedá E. Namiesto porovnania pravdepodobnosti E s ohľadom na H s jej bezpodmienečnou pravdepodobnosťou ju teraz porovnávame s jej pravdepodobnosťou podmienenou ~ H. LR(H, E) je teda miera, do akej hypotéza prekračuje svoju negáciu ako prediktor údajov. Bayesova veta nám ešte raz hovorí, ako premieňať podmienené pravdepodobnosti na bezpodmienečné pravdepodobnosti a miery prediktívnej sily.
Pravdepodobnosť predpokladanej hypotézy na súbore údajov sa rovná bezpodmienečným pravdepodobnostiam hypotézy vynásobeným stupňom, v akom prekračuje svoju negáciu ako prediktor údajov.
V našom bežiacom príklade J. Doe sa LR (H, E) získava porovnaním predvídateľnosti postavenia nadriadeného, keďže J. Doe zomrel v roku 2000 s jeho predvídateľnosťou, pretože prežil rok. Delenie bývalého "predpovedanie termín" od druhých výnosov LR (H, E) = P H (E) / P ~ H (E) = 0,57 / 0,056 = 10.12. Ako prediktor postavenia senior v roku 2000 je teda vedomie, že J. Doe zomrel, viac ako desaťkrát lepšie ako vedomie, že žil.
Podobnosti medzi „pravdepodobnostným pomerom“a „pravdepodobnostným pomerom“verzií Bayesovej vety sa môžu ďalej rozvíjať, ak vyjadríme pravdepodobnosť H ako násobok pravdepodobnosti nejakej inej hypotézy H * pomocou funkcie relatívnej pravdepodobnosti B (H, H *) = P (H) / P (H *). Malo by byť zrejmé, že B generalizuje P aj O, pretože P (H) = B (H, T) a O (H) = B (H, ~ H). Porovnaním podmienených a nepodmienených hodnôt B získame Bayesov faktor:
BR (H, H *, E) = B E (H, H *) / B (H, H *) = [ P E (H) / P E (H *)] / [ P (H) / P (H *)].
Môžeme tiež zovšeobecniť pomer pravdepodobnosti nastavením LR (H, H *, e) = P H (E) / P H * (E). Toto porovnáva predvídateľnosť E na základe H s jeho predvídateľnosťou na základe H *. Tieto dve množstvá môžeme použiť na formulovanie ešte všeobecnejšej formy Bayesovej vety.
(1.6) | Bayesova veta (všeobecná forma) |
BR (H, H *; E) = LR (H, H *; E) |
Správa (1.6) znie:
Pomer pravdepodobností pre dve hypotézy podmienené na súbore údajov je rovnaký ako pomer ich bezpodmienečných pravdepodobností vynásobený stupňom, do ktorého prvá hypotéza prevyšuje druhú ako prediktor údajov.
Rôzne verzie Bayesovej vety sa líšia iba v súvislosti s funkciami používanými na vyjadrenie bezpodmienečných pravdepodobností (P (H), O (H), B (H)) a v pravdepodobnostnom termíne používanom na vyjadrenie prediktívnej sily (PR (E, H), LR (H, E), LR (H, H *; E)). V každom prípade je však základná správa rovnaká:
podmienená pravdepodobnosť = bezpodmienečná pravdepodobnosť × prediktívna sila
(1.2) - (1.6) sú multiplikatívne formy Bayesovej vety, ktoré používajú rozdelenie na porovnanie rozdielov medzi bezpodmienečnými a podmienenými pravdepodobnosťami. Niekedy sú tieto porovnania najlepšie vyjadrené aditívne nahradením pomerov rozdielmi. Nasledujúca tabuľka uvádza aditívny analóg každého meradla pomeru.
stôl 1
pomer | Rozdiel |
Pomer pravdepodobnosti PR (H, E) = P E (H) / P (H) |
Pravdepodobný rozdiel PD (H, E) = P E (H) - P (H) |
Kurzový pomer OR (H, E) = O E (H) / O (H) |
Kurzový rozdiel OD (H, E) = O E (H) - O (H) |
Bayesův faktor BR (H, H *, E) = B E (H, H *) / B (H, H *) |
Bayesov rozdiel BD (H, H *; E) = B E (H, H *) - B (H, H *) |
Môžeme použiť Bayesovu vetu na získanie aditívnych analógov (1.4) - (1.6), ktoré sa tu zobrazujú spolu s ich multiplikatívnymi náprotivkami:
Tabuľka 2
pomer | Rozdiel | |
(1.4) | PR (H, E) = PR (E, H) = P H (E) / P (E) | PD (H, E) = P (H) [ PR (E, H) - 1] |
(1.5) | Alebo (H, E) = LR (H, E) = P H (E) / P ~ H (E) | OD (H, E) = 0 (H) [ OR (H, E) - 1] |
(1.6) | BR (H, H *, E) = LR (H, H *, E) = P H (E) / P H * (E) | BD (H, H *; E) = B (H, H *) [ BR (H, H *; E) - 1] |
Všimnite si, ako sa každé doplnkové opatrenie získa vynásobením bezpodmienečnej pravdepodobnosti H, vyjadrenej v príslušnej stupnici, P, O alebo B, pridruženým multiplikačným opatrením zníženým o 1.
Aj keď výsledky tejto časti sú užitočné pre každého, kto používa pravdepodobnostný počet, majú osobitný význam pre subjektivistické alebo „bayesovské“prístupy k štatistike, epistemológii a induktívnej inferencii. [5] Subjektivisti sa vo svojej teórii dôkaznej podpory a ich popis empirického učenia silne opierajú o podmienečné pravdepodobnosti. Vzhľadom na to, že Bayesova veta je jediným najdôležitejším faktom o podmienených pravdepodobnostiach, vôbec neprekvapuje, že by mala figurovať popredne v subjektivistickej metodológii.
3. Úloha Bayesovej vety v subjektivistických účtoch dôkazov
Subjektivisté tvrdí, že viera prísť v rôznom odstupňovania sily, a že triedené viery ideálne rozumne uvažujúci človek môže byť reprezentovaný subjektívne pravdepodobnostné funkcie P. Pre každú hypotézu H, o ktorej má daná osoba pevný názor, P (H) zmeria jej úroveň dôvery (alebo „stupňa viery“) v H pravdu. [6] Podmienené presvedčenie je podmienené pravdepodobnosťou, takže P E (H) meria dôveru osoby v H za predpokladu, že E je skutočnosť. [7]
Jednou z najvplyvnejších čŕt subjektivistického programu je jeho dôkazná podpora. Hlavné myšlienky tejto bayesovskej teórie potvrdzovania sú:
- Potvrdzujúca relativita. Dôkazné vzťahy musia byť relativizované k jednotlivcom a ich stupňom viery.
- Proporcionizmus dôkazov. [8] Racionálny veriaci porovná jej dôveru v hypotézu H s celkovým dôkazom H, takže jej subjektívna pravdepodobnosť H bude odrážať celkovú rovnováhu jej dôvodov pre alebo proti svojej pravde.
- Prírastkové potvrdenie. [9] Súbor údajov poskytuje dodatočné dôkazy o H do tej miery, že úprava údajov zvyšuje pravdepodobnosť H.
Prvý princíp hovorí, že vyhlásenia o dôkazných vzťahoch vždy implicitne odkazujú na ľudí a ich mieru viery, takže napríklad „E je dôkaz pre H“by sa mal skutočne interpretovať ako „E je dôkaz pre H v porovnaní s informáciami zakódovanými v subjektívna pravdepodobnosť P .
Podľa proporcionality dôkazov by sa miera dôvery jednotlivca v H mala meniť priamo v závislosti od sily jej dôkazov v prospech H pravdy. Podobne by sa jej úroveň dôvery v H podmienená E mala meniť priamo v závislosti od sily jej dôkazov o pravde H, keď sa tento dôkaz zvýši predpokladom E. Je vecou jemnosti povedať, čo presne predstavuje dôkaz osoby [10], a vysvetliť, ako by jej mala byť „viera“viera. Myšlienka, že prírastkové dôkazy sa odrážajú v rozdieloch medzi podmienenými a bezpodmienečnými pravdepodobnosťami, má zmysel iba vtedy, ak rozdiely v subjektívnej pravdepodobnosti odrážajú rozdiely v celkovom dôkaze.
Položka údajov poskytuje subjektu prírastkové dôkazy pre alebo proti hypotéze do tej miery, že príjem údajov zvyšuje alebo znižuje jej celkový dôkaz o pravdivosti hypotézy. Pri pravdepodobnosti meranie celkového dôkazy, prírastok dôkazov, že E poskytuje pre H je otázkou rozdielov medzi P E (H) a P (H). Ak sa používajú kurzy, ide o rozdiel medzi O E (H) a O (H). Pozri príklad 2 v doplnkovom dokumente „Príklady, tabuľky a náčrty náčrtov“, ktorý ilustruje rozdiel medzi celkovými a prírastkovými dôkazmi a vysvetľuje „základný omyl“, ktorý môže vyplynúť z toho, že sa tieto dva náležite nerozlišujú.
Bude užitočné rozlíšiť dva vedľajšie pojmy súvisiace s úplnými dôkazmi.
- Čistý dôkaz v prospech H je miera, do akej celkový dôkaz subjektu v prospech H presahuje jej celkový dôkaz v prospech ~ H.
- Zostatok celkových dôkazov pre H oproti H * je miera, do akej celkový dôkaz subjektu v prospech H presahuje jej celkový dôkaz v prospech H *.
Presný obsah týchto pojmov bude závisieť od toho, ako sa chápu a merajú celkové dôkazy, a od toho, ako sa charakterizujú rozdiely v celkových dôkazoch. Napríklad, ak je celkový dôkaz uvedený z hľadiska pravdepodobností a disparít sa zaobchádza ako s pomermi, potom čistý dôkaz pre H je P (H) / P (~ H). Ak je celkový dôkaz vyjadrený ako pravdepodobnosť a na vyjadrenie rozdielov sa použijú rozdiely, potom čistým dôkazom pre H bude O (H) - O (~ H). Čitatelia si môžu prečítať úplný zoznam možností v tabuľke 3 (v doplnkovom dokumente).
Ako tieto poznámky objasňujú, O (H) možno interpretovať buď ako mieru čistého dôkazu, alebo ako mieru celkového dôkazu. Aby ste videli rozdiel, predstavte si, že bolo náhodne a s výmenou z urny, o ktorej je známe, že obsahuje 10 000 červených alebo čiernych guličiek, nakreslených 750 červených guličiek a 250 čiernych guličiek. Za predpokladu, že toto je náš jediný dôkaz o obsahu urny, je rozumné nastaviť P (červená) = 0,75 a P(~ Červená) = 0,25. Pokiaľ ide o čítanie pravdepodobnosti ako súčtu, tieto priradenia odrážajú skutočnosť, že máme veľké množstvo dôkazov v prospech Red (konkrétne to, že 750 z 1 000 remíz bolo červené), a skutočnosť, že máme aj nejaké dôkazy proti nemu (menovite, že 250 žrebovaní bolo čiernych). Čistým dôkazom pre Red je potom rozdiel medzi našimi celkovými dôkazmi pre Red a našimi celkovými dôkazmi proti Red. Dá sa to vyjadriť multiplikatívne tvrdením, že sme videli trikrát toľko červených ťahov ako čiernych ťahov, čo znamená len to, že O (červená) = 3. Prípadne môžeme použiť O(Červená) ako miera celkového dôkazu tým, že náš dôkaz, že červená bude pomer červenej k čiernej, nie celkový počet červených ťahov, a naše dôkazy o tom, že červená je pomer čiernych guličiek k červenej gule, nie celkový počet čiernych ťahov. Zatiaľ čo rozhodnutie, či použiť O ako celkový alebo čistý dôkaz, má malý vplyv na otázky týkajúce sa absolútneho množstva celkového dôkazu pre hypotézu (keďže O (H) je rastúca funkcia P (H)), môže urobiť hlavný rozdiel pri posudzovaní prírastkových zmien v celkových dôkazoch spôsobených úpravou na nových informáciách.
Filozofi, ktorí sa zaujímajú o charakterizáciu správnych vzorcov indukčného zdôvodnenia ao poskytnutie „racionálnych rekonštrukcií“vedeckej metodológie, sa zameriavajú na čiastkové dôkazy, ktoré sú pre ich podnikanie rozhodujúce. Keď vedci (alebo obyčajní ľudia) hovoria, že E podporuje alebo potvrdzuje H, čo vo všeobecnosti znamenajú, že poznanie pravdy E zvýši celkové množstvo dôkazov o pravde H. Keďže subjektivisti charakterizujú celkový dôkaz z hľadiska subjektívnych pravdepodobností alebo šancí, analyzujú prírastkové dôkazy z hľadiska zmien v týchto množstvách. Z týchto názorov je najjednoduchším spôsobom charakterizovania sily prírastkových dôkazov poradové porovnanie podmienených a nepodmienených pravdepodobností alebo šancí.
(2.1) | Porovnávací účet prírastkových dôkazov. |
Vo vzťahu k subjektívnej pravdepodobnostnej funkcii P,
|
Obe tieto ekvivalencie sú naďalej pravdepodobnosti nahradené pravdepodobnosťou. Táto časť subjektivistickej teórie dôkazov nezávisí od toho, ako sa meria celkový dôkaz.
Bayesova teoréma pomáha osvetľovať obsah bodu (2.1) objasnením, že stav E ako prírastkového dôkazu pre H sa zvyšuje do tej miery, že H predpovedá E. Toto pozorovanie slúži ako základ pre nasledujúce závery o čiastočnom potvrdení (ktoré platia do 1> P (H), P (E)> 0).
(2.1a) | Ak E postupne potvrdí H, potom H postupne potvrdí E. |
(2.1b) | Ak E postupne potvrdzuje H, potom E postupne potvrdzuje ~ H. |
(2.1 c) | Ak H znamená E, potom E postupne potvrdí H. |
(2.1D) | Ak P H (E) = P H (E *), potom H prijíma viac prírastkové podporu z E, než z E * vtedy a len vtedy, ak E je bezpodmienečne menej pravdepodobný ako E *. |
(2.1e) | Zásada slabej pravdepodobnosti. E poskytuje dôkaz pre inkrementálne H práve vtedy, keď P H (E)> P ~ H (E). Všeobecnejšie povedané, ak je P H (E)> P H * (E), a P ~ H (~ E) ≥ P ~ H * (~ E), potom E poskytuje ďalší dôkaz pre prírastkové H ako pre H *. |
(2.1a) nám hovorí, že postupné potvrdenie je vecou vzájomného posilnenia: osoba, ktorá vidí E ako dôkaz pre H, investuje viac dôvery do možnosti, že obidva návrhy sú pravdivé, než v ktorúkoľvek z možností, ktorú získa iba jeden.
(2.1b) hovorí, že príslušné dôkazy musia byť schopné rozlišovať medzi pravdou a nepravdivosťou testovanej hypotézy.
(2.1c) poskytuje subjektívne odôvodnenie hypoteticko-deduktívneho modelu potvrdenia. Podľa tohto modelu sa hypotézy postupne potvrdzujú akýmikoľvek dôkazmi, ktoré obsahujú. Kým subjektivisti odmietajú myšlienku, že vzťahy medzi dôkazmi možno charakterizovať spôsobom nezávislým od viery - Bayesovské potvrdenie je vždy relativizované k osobe a jej subjektívnym pravdepodobnostiam - snažia sa zachovať základný pohľad na model HD tým, že poukazujú na to, že hypotézy sa postupne podporujú. dôkazmi, ktoré znamenajú pre každého, kto sa už nerozhodol pre hypotézu alebo dôkazy. Presnejšie, ak H znamená E, potom P E (H) = P (H) / P (E), ktoré presahuje P (H), kedykoľvek 1> P (E), P (H)> 0. Toto vysvetľuje, prečo sa vedci tak často snažia navrhnúť experimenty, ktoré zodpovedajú paradigme HD. Aj keď sa vzťahy medzi dôkazmi relativizujú na subjektívne pravdepodobnosti, pokusy, pri ktorých testovaná hypotéza zahŕňa údaje, budú považovať za zjavne relevantné ktokoľvek, kto sa ešte nerozhodol o hypotéze alebo údajoch. Stupeň postupného potvrdzovania sa bude u ľudí líšiť v závislosti od ich predchádzajúcej úrovne dôvery v H a E, ale všetci súhlasia s tým, že údaje zvyšujú hypotézu aspoň do určitej miery.
Subjektivisti sa odvolávajú na (2.1d), aby vysvetlili, prečo vedci tak často považujú nepravdepodobné alebo prekvapujúce dôkazy za dôkaz, ktorý má väčší potvrdzujúci potenciál ako dôkazy, ktoré sú známe už skôr. Aj keď vo všeobecnosti nie je pravda, že nepravdepodobné dôkazy majú viac potvrdzujúci potenciál, je pravda, že inkrementálna potvrdzovacia sila E voči H sa mení inverzne s nepodmienenou pravdepodobnosťou E, keď je hodnota inverznej pravdepodobnosti P H(E) je držaný pevne. Ak H znamená E a E *, povedzme, potom Bayesova veta znamená, že najmenej pravdepodobné z týchto dvoch podporuje H silnejšie. Napríklad, aj keď sú srdcové infarkty vždy sprevádzané silnou bolesťou na hrudníku a dýchavičnosťou, prvý príznak je oveľa lepším dôkazom srdcového infarktu ako ten druhý jednoducho preto, že silná bolesť na hrudníku je oveľa menej bežná ako dýchavičnosť.
(2.1e) zachytáva jedno základné posolstvo Bayesovej vety pre teórie potvrdenia. Povedzme, že H je jednotne lepšia ako H * ako prediktor pravdivej hodnoty E, keď (a) H predpovedá E silnejšie ako H * a b) ~ H predpovedá ~ E silnejšie ako ~ H *. Podľa zásady slabej pravdepodobnosti údaje lepšie podporujú hypotézy, ktoré sú jednotne lepšími prediktormi údajov. Napríklad skutočnosť, že malý Johnny je kresťan, je lepším dôkazom toho, že si myslia, že jeho rodičia sú kresťania, než že si myslia, že sú hinduisti, pretože (a) oveľa väčší podiel kresťanských rodičov ako hinduistov majú kresťanské deti; a (b) omnoho vyšší podiel nekresťanských rodičov než ne-hinduistických rodičov má nekresťanské deti.
Bayesov teorém možno použiť aj ako základ pre vývoj a hodnotenie kvantitatívnych opatrení dôkaznej podpory. Výsledky uvedené v tabuľke 2 znamenajú, že všetky štyri funkcie PR, OR, PD a OD sa navzájom zhodujú na najjednoduchšej otázke potvrdenia: Poskytuje E prírastkové dôkazy o H?
(2.2) | Dôsledok. |
Každý z nasledujúcich je ekvivalent tvrdenia, že E poskytuje prírastkové dôkazy v prospech H: PR (H, E)> 1, OR (H, E)> 1, PD (H, E)> 0, OD (H, E)> 0. |
Všetky štyri opatrenia teda súhlasia s porovnávacím dôkazom o dodatočných dôkazoch uvedeným v bode 2.1.
Vzhľadom na celú túto dohodu by nemalo byť prekvapujúce, že všetky PR (H, E), OR (H, E) a PD (H, E) boli navrhnuté ako opatrenia stupňa prírastkovej podpory, ktorú E poskytuje H. [11] Zatiaľ čo OD(H, E) na tento účel nebol navrhnutý, budeme to zvažovať z dôvodu symetrie. Niektorí autori tvrdia, že jedna alebo druhá z týchto funkcií je jedinečným správnym meradlom prírastkových dôkazov; iní sa domnievajú, že je najlepšie použiť rôzne opatrenia, ktoré zachytávajú rôzne dôkazné vzťahy. Aj keď to nie je miesto na riešenie týchto otázok, môžeme sa pozrieť na Bayesovu teorému, aby nám pomohli pochopiť, čo rôzne funkcie merajú, a charakterizovať formálne vzťahy medzi nimi.
Všetky štyri opatrenia sa vo svojich záveroch zhodujú v porovnávacom množstve prírastkových dôkazov, že rôzne položky údajov poskytujú pevnú hypotézu. Súhlasia najmä s nasledujúcimi pojmami odvodenými z dodatočných dôkazov:
- Efektívny prírastok dôkazov [12], ktorý E poskytuje H, je suma, o ktorú prírastkový dôkaz, ktorý E poskytuje H, prevyšuje prírastkový dôkaz, ktorý ~ E poskytuje H.
- Rozdiel v prírastkových dôkazoch, že E a E * poskytujú H, je čiastka, o ktorú prírastkový dôkaz, ktorý E poskytuje H, prevyšuje prírastkový dôkaz, ktorý E * poskytuje H.
Účinný dôkaz je záležitosťou stupňa, v akom celkový dôkaz osoby o H závisí od jej názoru na E. Ak sú P E (H) a P ~ E (H) (alebo O E (H) a O ~ E (H)) od seba veľmi vzdialené, viera osoby v E má veľký vplyv na jej vieru v H: z jej hľadiska Ak sa pozrieme na otázky týkajúce sa pravdivosti hodnoty H, veľa visí na skutočnej hodnote E. Veľký rozdiel v prírastkových dôkazoch medzi E a E * nám hovorí, že učenie E zvyšuje celkový dôkaz subjektu o H o väčšie množstvo ako učenie E *. Čitatelia si môžu prečítať tabuľku 4 (v dodatku) o kvantitatívnych mierach účinných a odlišných dôkazov.
Druhá veta bodu (2.1) hovorí, že E poskytuje viac prírastkových dôkazov ako E * pre H iba v prípade, že pravdepodobnosť H podmienená E presiahne pravdepodobnosť H podmienená E *. Potom je to jednoduchý krok, ktorý ukazuje, že všetky štyri opatrenia prírastkovej podpory sa zhodujú v otázkach efektívnych dôkazov a rozdielov v prírastkových dôkazoch.
(2.3) | Dôsledok. |
Pre všetky H, E * a E s pozitívnou pravdepodobnosťou sú ekvivalentné:
|
Štyri miery prírastkovej podpory môžu nesúhlasiť s porovnávacím stupňom, v akom jedna položka údajov postupne potvrdzuje dve odlišné hypotézy. Príklad 3, príklad 4 a príklad 5 (v dodatku) ukazujú rôzne spôsoby, ako k tomu môže dôjsť.
Všetky rozdiely medzi opatreniami sa v konečnom dôsledku týkajú a) toho, či by sa celkový dôkaz v prospech hypotézy mal merať na základe pravdepodobností alebo pravdepodobnosti a b) či sa rozdiely v celkových dôkazoch najlepšie zachytia ako pomery. alebo ako rozdiely. Riadky v nasledujúcej tabuľke zodpovedajú rôznym mieram celkových dôkazov. Stĺpce zodpovedajú rôznym spôsobom riešenia rozdielov.
Tabuľka 5: Štyri miery čiastkových dôkazov
pomer | Rozdiel | |
P = celkom | PR (H, E) = P E (H) / P (H) | PD (H, E) = P E (H) - P (H) |
O = Spolu | Alebo (H, E) = O E (H) / O (H) | OD (H, E) = O E (H) - O (H) |
Podobné tabuľky je možné zostaviť pre miery čistých dôkazov a pre bilancie bilancií v rámci celkových dôkazov. Pozri tabuľku 5A v dodatku.
Môžeme použiť rôzne formy Bayesovho vety na objasnenie podobností a rozdielov medzi týmito mierami prepísaním každej z nich z hľadiska pravdepodobnosti.
Tabuľka 6: Štyri opatrenia vyjadrené ako pravdepodobnosť
pomer | Rozdiel | |
P = celkom | PR (H, E) = LR (H, T; E) | PD (H, E) = P (H) [ LR (H, T; E) - 1] |
O = Spolu | OR (H, E) = LR (H, ~ H; E) | OD (H, E) = 0 (H) [ LR (H, H; E) - 1] |
Táto tabuľka ukazuje, že existujú dva rozdiely medzi každým multiplikačným opatrením a jeho doplnkovým ekvivalentom. Po prvé, pravdepodobnosť, ktorá sa objavuje v danom multiplikačnom opatrení, je znížená o 1 v príslušnom doplnkovom meradle. Po druhé, v každom aditívnom opatrení sa znížená pravdepodobnosť krát vynásobí vyjadrením pravdepodobnosti H: P (H) alebo O (H), podľa okolností. Prvý rozdiel neznamená žiadne rozlíšenie; je to spôsobené výlučne skutočnosťou, že multiplikačné a aditívne opatrenia využívajú iný nulový bod, od ktorého sa merajú dôkazy. Ak sa usídlime v bode pravdepodobnostnej nezávislosti P E (H) = P (H) ako prirodzená spoločná nula, a tak od každého multiplikatívneho meradla odpočítame 1,[13] sa potom v oboch stĺpcoch objavia rovnaké termíny pravdepodobnosti.
Skutočný rozdiel medzi opatreniami v danom riadku sa týka vplyvu bezpodmienečných pravdepodobností na vzťahy prírastkového potvrdenia. V pravom stĺpci je stupeň, do ktorého E poskytuje inkrementálny dôkaz pre H, priamo úmerný pravdepodobnosti H vyjadrenej v jednotkách P (T) alebo P (~ H). V ľavom stĺpci, H je pravdepodobnosť, nezáleží na množstvo dôkazov, že kumulatívne E zabezpečuje H raz P H (E) a buď P (E) alebo P ~ H (E) sú pevné. [14] Vo svetle Bayesovej vety sa teda rozdiel medzi mierovými pomermi a rozdielnymi mierami zmenšuje na jednu otázku:
Poskytuje daný údaj väčší prírastok dôkaznej podpory pre pravdepodobnejšiu hypotézu ako pre menej pravdepodobnú hypotézu, keď obe hypotézy predpovedajú údaje rovnako dobre?
Rozdielne opatrenia odpovedajú áno, pomerové opatrenia odpovedajú nie.
Bayesova veta nám tiež môže pomôcť pochopiť rozdiel medzi riadkami. Opatrenia v danom riadku sa zhodujú na úlohe predvídateľnosti pri postupnom potvrdzovaní. V hornom riadku prírastkové dôkaz, že E stanovuje H zvyšuje lineárne s P H (E) / P (E), zatiaľ čo v spodnej rade lineárne sa zvyšuje s P H (E) / P ~ H (E). Teda, keď pravdepodobnosti zmerajú celkový dôkaz, na čom záleží, je dôležitá miera, do ktorej H prekračuje T ako prediktor E, ale keď miera pravdepodobnosti zmeria celkový dôkaz, záleží na tom, do akej miery H prekračuje H ako prediktor E.
Hlavná otázka sa tu týka stavu pravdepodobnosti. Aj keď každý súhlasí s tým, že by mal zohrávať vedúcu úlohu v akejkoľvek kvantitatívnej teórii dôkazov, existujú protichodné názory na to, čo presne dokazujúci vzťah zachytáva. Existujú tri možné interpretácie.
Tabuľka 7: Tri interpretácie pravdepodobnosti
Pravdepodobnosť čítania úplných dôkazov |
|
Kurzy ako celkový počet prečítaných dôkazov |
|
Čítanie „pravdepodobnosť“ |
|
V prvom čítaní neexistuje žiaden konflikt medzi použitím pravdepodobnostných pomerov a použitím pravdepodobnostných pomerov na meranie dôkazov. Keď vyjasníme rozlíšenie medzi celkovým dôkazom, čistým dôkazom a vyvážením dôkazov, zistíme, že každý z PR (H, E), LR (H, E) a LR (H, H *; E) meria dôležitý dôkazné vzťahy, ale vzťahy, ktoré merajú, sú výrazne odlišné.
Ak šance merajú celkový dôkaz, PR (H, E) ani LR (H, H *; E) nehrajú v teórii dôkazov zásadnú úlohu. Zmeny v pravdepodobnostnom pomere pre H daný E naznačujú iba zmeny v prírastkových dôkazoch v prítomnosti informácií o zmenách v pravdepodobnostnom pomere pre ~ H daný E. Podobne aj zmeny v pravdepodobnosti pre H a H * vzhľadom na E naznačujú iba zmeny v bilancii dôkazov na základe informácií o zmenách v pravdepodobnosti pre ~ H a ~ H * pri E. Takže zatiaľ čo každá z týchto dvoch funkcií môže figurovať ako jedna zložka v zmysluplnej miere potvrdenia, ani jedna z nich nám nehovorí o čiastkových dôkazoch, keď sa vezme sama.
Tretí pohľad „pravdepodobnosť“je obľúbený medzi ne Bayesovskými štatistikmi. Jeho zástancovia popierajú proporcionalitu dôkazov. Tvrdia, že subjektívna pravdepodobnosť hypotézy osoby odráža iba jej mieru neistoty o jej pravde; nemusí sa nijako spájať s množstvom dôkazov, ktoré má v jeho prospech. [15] Zachytávajú „vedecky zmysluplné“dôkazné vzťahy. Ide o pravdepodobnosti, nie o subjektívne pravdepodobnosti. Tu sú dve klasické výroky o pozícii.
Všetky informácie, ktoré údaje poskytujú o relatívnych výhodách dvoch hypotéz, sú obsiahnuté v pravdepodobnom pomere hypotéz k údajom. (Edwards 1972, 30)
„Dôkazný význam“experimentálnych výsledkov je plne charakterizovaný funkciou pravdepodobnosti… Správy o experimentálnych výsledkoch vo vedeckých časopisoch by v zásade mali byť opisy funkcií pravdepodobnosti. (Brinbaum 1962, 272)
Z tohto hľadiska je všetko, čo sa dá povedať o dôkaznom dovoze E pre H, zakomponované do nasledujúcej zovšeobecnenia zásady nízkej pravdepodobnosti:
„Zákon pravdepodobnosti“. Ak H znamená, že pravdepodobnosť E je x, zatiaľ čo H * znamená, že pravdepodobnosť E je x *, potom E je dôkaz podporujúci H nad H * iba vtedy, ak x presahuje x * a pomer pravdepodobnosti x / x *, meria silu tejto podpory. (Hacking 1965, 106 - 109), (Royall 1997, 3)
Biostatista Richard Royall je obzvlášť prehľadným obhajcom pravdepodobnosti (Royall 1997). Tvrdí, že každý vedecky prijateľný pojem dôkazov musí analyzovať dôkazný vplyv E na H výlučne z hľadiska pravdepodobnosti; nemala by poukazovať na bezpodmienečné pravdepodobnosti E alebo H pre kohokoľvek. Malo by to byť preto, že pravdepodobnosti sú známe a objektívnejšie ako bezpodmienečné pravdepodobnosti. Royall tvrdo argumentuje proti myšlienke, že prírastkové dôkazy možno merať z hľadiska rozdielov medzi bezpodmienečnými a podmienenými pravdepodobnosťami. Tu je podstata jeho sťažnosti:
Zatiaľ čo [ LR (H, H *; E)] meria podporu jednej hypotézy H vo vzťahu ku konkrétnej alternatíve H *, bez ohľadu na predchádzajúcu pravdepodobnosť týchto dvoch hypotéz alebo na to, aké ďalšie hypotézy by sa mohli brať do úvahy, zákon pravdepodobnosti zmeny [merané pomocou PR(H, E)] meria podporu pre H vo vzťahu k špecifickému predchádzajúcemu rozdeleniu na H a jeho alternatívy … Zákon o zmene pravdepodobnosti má vo vedeckom diskurze obmedzenú užitočnosť, pretože je závislý od predchádzajúceho rozdelenia pravdepodobnosti, ktoré je všeobecne neznáme a / alebo alebo osobné. Aj keď sa s nami súhlasíme (na základe zákona o pravdepodobnosti), že dané dôkazy podporujú H nad H * a H ** nad H * a H *, môžeme sa nezhodnúť, či ide o dôkazy podporujúce H (na základe zákon o zmene pravdepodobnosti) výlučne na základe našich rôznych rozsudkov o pravdepodobnosti H, H * a H ** a priori. (Royall 1997, 10-11, s malými zmenami v zápise)
Royall tvrdí, že ani pravdepodobnostný pomer, ani rozdiel pravdepodobnosti nezachytí druh objektívnych dôkazov požadovaných vedou, pretože ich hodnoty závisia od „subjektívnych“výrazov P (E) a P (H), a nielen od „objektívnych“pravdepodobností P H (E) a P ~ H (E).
To, či niekto súhlasí s týmto hodnotením, bude záležitosťou filozofického temperamentu, najmä jeho ochoty tolerovať subjektívne pravdepodobnosti v správe o dôkazných vzťahoch. Bude tiež zásadne závisieť od miery, do akej je človek presvedčený, že pravdepodobnosti sú lepšie známe a objektívnejšie ako bežné subjektívne pravdepodobnosti. Prípady, ako je prípad uvedený v zákone o pravdepodobnosti, kde hypotéza deduktivne predpokladá určitú pravdepodobnosť údajov, sú pomerne zriedkavé. Pokiaľ teda nie je ochotný prijať teóriu dôkazov s veľmi obmedzeným rozsahom použitia, bude sa veľa zaoberať tým, aké ľahké je určiť objektívne pravdepodobnosti v situáciách, keď prediktívne spojenie medzi hypotézou a údajmi je samo osebe výsledkom induktívneho účinku. závery. Jeden však príde o týchto otázkach,nemožno však poprieť, že pravdepodobnostné pomery budú hrať ústrednú úlohu pri každom pravdepodobnostnom popise dôkazov.
Zásada nízkej pravdepodobnosti (2.1e) v skutočnosti obsahuje minimálnu formu bayesianizmu, s ktorou sa môžu všetky strany dohodnúť. Toto je najjasnejšie, keď sa prehodnotí pravdepodobnosť.
(2.1e) | Zásada slabej pravdepodobnosti. (vyjadrené ako pomer pravdepodobnosti) |
Ak LR (H, H *; E) ≥ 1 a LR (~ H, ~ H *; ~ E) ≥ 1, s jednou prísnou nerovnosťou, potom E poskytne viac prírastkových dôkazov pre H ako pre H * a ~ E poskytuje viac prírastkový dôkaz pre ~ H ako pre ~ H *. |
Pravdepodobnosť bude podporovaná (2.1e), pretože vzťahy opísané v jej predchodcovi závisia iba od inverzných pravdepodobností. Navrhovatelia interpretácie „pravdepodobnosti“a „pravdepodobnosti“interpretácie úplného dôkazu budú akceptovať (2.1e), pretože uspokojenie jej predchodcu zabezpečí, že podmienenie E zvýši pravdepodobnosť H a jeho šance prísne viac ako pravdepodobnosť H *. Zásada nízkej pravdepodobnosti musí byť neoddeliteľnou súčasťou každého dôkazu o dôležitosti, ktorý si zaslúži názov „Bayesiánsky“. Popierať to znamená nepochopenie ústredného posolstva Bayesovej vety, pokiaľ ide o dôkazy, konkrétne, že hypotézy potvrdzujú údaje, ktoré predpovedajú. Ako uvidíme v nasledujúcej časti, táto „minimálna“forma bayesianizmu sa významne premieta do subjektivistických modelov učenia sa zo skúsenosti.
4. Úloha Bayesovej vety v subjektivistických modeloch učenia
Subjektivisti uvažujú o učení ako o procese viery, v ktorom je „predchádzajúca“subjektívna pravdepodobnosť P nahradená „zadnou“pravdepodobnosťou Q, ktorá obsahuje novo získané informácie. Tento proces prebieha v dvoch fázach. Po prvé, niektoré z pravdepodobností predmetu sú priamo zmenené skúsenosťami, intuíciou, pamäťou alebo iným inferenčným procesom učenia. Po druhé, téma „aktualizuje“zvyšok svojich názorov, aby ich zosúladila so svojimi novo nadobudnutými znalosťami.
Mnoho subjektivistov je spokojných považovať počiatočné zmeny viery za sui generis a nezávislé od predchádzajúceho názoru veriaceho. Pokiaľ sa však prvá fáza procesu učenia chápe ako neinferenciálna, subjektivizmus sa môže stať zlučiteľným s „externistickou“epistemológiou, ktorá umožňuje kritizovať zmeny viery, pokiaľ ide o spoľahlivosť kauzálnych procesov, ktoré ich generujú. Môže dokonca vyhovieť myšlienke, že priamy účinok skúsenosti môže príčinne závisieť od predchádzajúcej pravdepodobnosti veriaceho.
Subjektivisti podrobne študovali druhú inferenčnú fázu procesu učenia. Tu sú okamžité zmeny viery vnímané ako ukladajúce obmedzenia formy „zadná pravdepodobnosť Qmá také a takéto vlastnosti. “Cieľom je zistiť, aké druhy obmedzení skúsenosti majú tendenciu ukladať, a vysvetliť, ako možno predchádzajúce názory osoby použiť na zdôvodnenie výberu zadnej pravdepodobnosti spomedzi mnohých, ktoré by mohli uspokojiť Subjektivisti pristupujú k druhému problému tým, že predpokladajú, že agent je oprávnený prijať akékoľvek vhodné zadné odchýlenie sa minimálne od jej predchádzajúcich názorov. Toto je druh požiadavky „bez skokov k záverom“. Vysvetľujeme to tu ako prirodzený výsledok myšlienka, že racionálni študenti by mali svoje presvedčenie úmerať sile dôkazov, ktoré získajú.
Najjednoduchšie skúsenosti s učením sú také, v ktorých sa študentka presvedčí o pravde o nejakom výroku E, o ktorom bola predtým neistá. Tu platí obmedzenie, že všetkým hypotézam, ktoré nie sú v súlade s E, sa musí priradiť pravdepodobnosť nula. Subjektivisti modelujú tento druh učenia ako jednoduché kondicionovanie, proces, v ktorom je predchádzajúca pravdepodobnosť každého výroku H nahradená zadnou stranou, ktorá sa zhoduje s predchádzajúcou pravdepodobnosťou H podmienenou E.
(3.1) | Jednoduché kondicionovanie |
Ak má osoba s „predchádzajúcim“takú skúsenosť, že 0 < P (E) <1, má vzdelávaciu skúsenosť, ktorej jediným okamžitým účinkom je zvýšenie jej subjektívnej pravdepodobnosti pre E na 1, mala by jej post-learningová „posteriórna“pre akúkoľvek ponuku H byť Q (H) = P E (H). |
Stručne povedané, racionálny veriaci, ktorý sa učí s istotou, že E je pravdivý, by mal tieto informácie zahrnúť do svojho doxastického systému tým, že ich upraví.
Aj keď je to užitočné ako ideálne, jednoduché kondicionovanie nie je široko aplikovateľné, pretože si od študenta vyžaduje, aby sa úplne presvedčil o pravde E. Ako argumentoval Richard Jeffrey (Jeffrey 1987), dôkazy, ktoré dostávame, sú často príliš vágne alebo nejednoznačné na to, aby opodstatnili taký „dogmatizmus“. Na realistickejších modeloch bude priamym účinkom vzdelávacej skúsenosti zmena subjektívnej pravdepodobnosti nejakého výroku bez toho, aby sa zvýšila na 1 alebo aby sa znížila na 0. Skúsenosti tohto druhu sú primerane modelované podľa toho, čo sa nazýva Jeffrey klimatizácia (Jeffreyov preferovaný termín je však „kinematika pravdepodobnosti“).
(3.2) | Jeffrey kondicionovanie |
Ak má osoba s takým predchádzajúcim obdobím, že 0 < P (E) <1, má vzdelávaciu skúsenosť, ktorej jediným bezprostredným účinkom je zmena jej subjektívnej pravdepodobnosti pre E na q, potom jej post-learningové posteriórum pre akékoľvek H by malo byť Q (H) = q P E (H) + (1 - q) P ~ E (H). |
Jeffreyova klimatizácia sa samozrejme redukuje na jednoduché kondicionovanie, keď q = 1.
V literatúre sa nachádza množstvo argumentov na úpravu (jednoduchý alebo Jeffreyov štýl), ale nemôžeme ich tu brať do úvahy. [16] Existuje však jeden druh odôvodnenia, v ktorom Bayesova teoréma figuruje na poprednom mieste. Využíva prepojenia medzi revíziou viery a predstavou prírastkových dôkazov, aby preukázal, že podmienenie je jediným pravidlom revízie viery, ktoré umožňuje študentom správne proporcie svojich zadných názorov k novým dôkazom, ktoré dostávajú.
Kľúčom k argumentu je spojenie „minimálnej“verzie bayesiánskej verzie uvedenej v bode 2.1e s veľmi skromnou „proporčnou“požiadavkou na pravidlá revízie viery.
(3.3) | Zásada slabých dôkazov |
Ak, v porovnaní s predchádzajúcim P, E poskytne aspoň toľko prírastkových dôkazov pre H ako pre H *, a ak je H pravdepodobnejšie pravdepodobnejšie ako H *, potom H by malo zostať pravdepodobnejšie ako H * po každej vzdelávacej skúsenosti, ktorej jediným okamžitým efektom je zvýšenie pravdepodobnosti E. |
To si vyžaduje, aby si agent zachoval svoje názory na relatívnu pravdepodobnosť dvoch hypotéz, keď získa dôkaz, ktorý podporuje pravdepodobnejšiu hypotézu silnejšie. Vylučuje zjavne iracionálne revízie viery, ako je táto: George je presvedčený, že New York Yankees vyhrá vlajku americkej ligy, než že je to, že ju vyhrá Boston Rex Sox, ale obráti sa, keď sa dozvie (iba), že Yankees porazil Red Sox v včerajšej hre.
Kombinácia (3.3) s minimálnym bayesianizmom vedie k nasledujúcemu:
(3.4) | dôsledok |
Ak je osoba v minulosti taká, že LR (H, H *; E) ≥ 1, LR (~ H, ~ H *; ~ E) ≥ 1 a P (H)> P (H *), potom akákoľvek skúsenosť so vzdelávaním ktorých jediným okamžitým účinkom je zvýšenie jej subjektívnej pravdepodobnosti E, by malo viesť k zadnému koncu, takže Q (H)> Q (H *). |
Za odôvodneného predpokladu, že Q je definované v rovnakom súbore návrhov, nad ktorými je definované P, táto podmienka postačuje na výber jednoduchého kondicionovania ako jedinečnej správnej metódy revízie viery pre vzdelávacie skúsenosti, ktoré zabezpečujú E istotu. Vyberá Jeffreyovu kondicionáciu ako jedinečnú správnu metódu, keď sa učenie iba mení subjektívnu pravdepodobnosť E. Argument pre tieto závery používa nasledujúce dve skutočnosti o pravdepodobnosti.
(3.5) | lemma |
Pokiaľ obidva H a H * znamenajú E, keď P (H)> P (H *), potom LR (H, H *; E) = 1
a LR (~ H, ~ H *; ~ E)> 1. |
|
Skúšobná ukážka |
(3.6) | lemma |
Jednoduché kondicionovanie na E je jediným pravidlom na prehodnotenie subjektívnych pravdepodobností, ktoré poskytujú posterior s nasledujúcimi vlastnosťami pre všetky predchádzajúce také, ktoré P (E)> 0:
|
|
Skúšobná ukážka |
Odtiaľ je argument pre jednoduché kondicionovanie záležitosťou použitia (3.4) a (3.5) na stanovenie ordinálnej podobnosti. Predpokladajme, že H a H * znamenajú E a P (H)> P (H *). Z bodu (3.5) vyplýva, že LR (H, H *; E) = 1 a LR (~ H, ~ H *; ~ E)> 1. (3.4) potom znamená, že každá vzdelávacia skúsenosť, ktorá zvyšuje pravdepodobnosť E, musí byť výsledkom je zadná strana s Q (H)> Q (H *). Tak, Q a P sú ordinally podobné, pokiaľ ide o hypotézy, ktoré znamenajú atóm vodíka. Ak budeme predpokladať, že skúsenosť so vzdelávaním zvyšuje pravdepodobnosť E na 1, potom (3.6) potom zaručuje, že Q vyplýva z P jednoduchou úpravou na E.
Prípad úpravy Jeffrey je podobne priamy. Keďže argument pre ordinálnu podobnosť vôbec nezávisel od predpokladu, že Q (E) = 1, skutočne sme preukázali,
(3.7) | dôsledok |
• Ak H a H * znamenajú E, potom P (H)> P (H *) iba vtedy, ak Q (H)> Q (H *). | |
• Ak H a H * znamenajú ~ E, potom P (H)> P (H *) iba vtedy, ak Q (H)> Q (H *). |
Takže Q je spravidla podobná ako P, keď je obmedzená na hypotézy, ktoré zahŕňajú E, aj keď je obmedzená na hypotézy, ktoré zahŕňajú ~ E. Okrem toho, pretože delenie kladnými číslami nenarúša ordinálne vzťahy, z toho tiež vyplýva, že Q E je bežne podobné P, keď je obmedzené na hypotézy, ktoré zahŕňajú E, a že Q ~ E je bežne podobné P, keď je obmedzené na hypotézy, než to znamená ~ E. Pretože Q E (E) = 1 = Q ~ E (E), (3.6) potom znamená:
(3.8) | dôsledok |
Pre každú ponuku H, Q E (H) = P E (H) a Q ~ E (H) = P ~ E (H) |
Je ľahké ukázať, že (3.8) je nevyhnutné a dostatočné, aby Q vzniklo z P Jeffreyho kondicionovaním na E. V závislosti na pridržiavacie Q (E) = q, to zaručuje, že Q (H) = q P E (H) + (1 - q) P ~ E (H).
Všeobecná morálka je jasná.
Základné Bayesovské chápanie stelesnené v zásade slabej pravdepodobnosti (2.1e) znamená, že jednoduché a Jeffreyovo kondicionovanie E je jediným racionálnym spôsobom, ako prehodnotiť vieru v reakcii na vzdelávacie skúsenosti, ktorých jediným okamžitým účinkom je zmena pravdepodobnosti E.
Aj keď sa dá povedať oveľa viac o jednoduchom kondicionovaní, Jeffreyovom kondicionovaní a iných formách revízie viery, tieto poznámky by mali dať čitateľovi zmysel pre dôležitosť Bayesovej vety v subjektívnych správach o výučbe a dôkazovej podpore. Matematická trivialita, centrálna veta Theorem - že hypotéza je podporovaná akýmkoľvek súborom údajov, ktoré poskytuje, je jadrom všetkých subjektívnych prístupov k epistemológii, štatistike a indukčnej logike.
Bibliografia
- Armendt, B. 1980. „Existuje holandský argument knihy o kinematike pravdepodobnosti?“, Philosophy of Science 47, 583-588.
- Bayes, T. 1764. "Esej k riešeniu problému v doktríne šancí", filozofické transakcie Kráľovskej spoločnosti v Londýne 53, 370-418. [Fascimile je k dispozícii online: pôvodná práca s úvodom od jeho priateľa Richarda Pricea]
- Birnbaum A. 1962. „O základoch štatistického zisťovania“, Vestník Americkej štatistickej asociácie 53, 259-326.
- Carnap, R. 1962. Logické základy pravdepodobnosti, 2. vydanie. Chicago: University of Chicago Press.
- Chihara, C. 1987. "Niektoré problémy pre Bayesovskú teóriu potvrdzovania", British Journal for Philosophy of Science 38, 551-560.
- Christensen, D. 1999. "Measuring Evidence", Journal of Philosophy 96, 437-61.
- Dale, AI 1989. "Thomas Bayes: A Memorial", The Mathematical Intelligencer 11, 18-19.
- ----- 1999. História inverznej pravdepodobnosti, 2. vydanie. New York: Springer-Verlag.
- Earman, J. 1992. Bayes alebo Bust? Cambridge, MA: MIT Press.
- Edwards, AWF 1972. Pravdepodobnosť. Cambridge: Cambridge University Press.
- Glymour, Clark. 1980. Teória a dôkazy. Princeton: Princeton University Press.
- Hacking, Ian. 1965. Logika štatistických záverov. Cambridge: Cambridge University Press.
- Hájek, A. 2003. "Interpretácie pravdepodobnostného počtu", v Stanfordskej encyklopédii filozofie, (vydanie Summer 2003), Edward N. Zalta (ed.), URL =
- Hammond, P. 1994. "Elementárne nearchitektické reprezentácie pravdepodobnosti pre teóriu rozhodovania a hry," v P. Humphreys, ed., Patrick Suppes: Scientific Philosopher, zv. 1, Dordrecht: Kluwer Publishers, 25-62.
- Harper, W. 1976. „Racionálne zmeny viery, popperove funkcie a kontrafaktuály“, W. Harper a C. Hooker, ed., Základy teórie pravdepodobnosti, štatistický odvod a štatistické teórie vedy, zv. Ja. Dordrecht: Reidel, 73-115.
- Hartigan, JA 1983. Bayes Theory. New York: Springer-Verlag.
- Howson, Colin. 1985. „Niektoré nedávne námietky proti Bayesovskej teórii podpory“, British Journal for Philosophy of Science, 36, 305-309.
- Jeffrey, R. 1987. "Alias Smith a Jones: Svedectvo o zmysloch", Erkenntnis 26, 391-399.
- ----- 1992. Pravdepodobnosť a umenie súdenia. New York: Cambridge University Press.
- Joyce, JM 1999. Základy teórie kauzálneho rozhodovania. New York: Cambridge University Press.
- Kahneman, D. a Tversky, A. 1973. "O psychológii predikcie", Psychological Review 80, 237-251.
- Kaplan, M. 1996. Teória rozhodovania ako filozofia. Cambridge: Cambridge University Press.
- Levi, I. 1985. "Nepresnosť a neurčitosť pri rozhodovaní o pravdepodobnosti", Philosophy of Science 53, 390-409.
- Maher, P. 1996. "Subjektívne a objektívne potvrdenie", Philosophy of Science 63, 149-174.
- McGee, V. 1994. "Učenie nemožného", v E. Eells a B. Skyrms, ed., Pravdepodobnosť a podmienky. New York: Cambridge University Press, 179-200.
- Mortimer, Halina. 1988. Logika indukcie, Ellis Horwood Series v Artificial Intelligence, New York; Halsted Press.
- Nozick, R. 1981. Filozofické vysvetlenie. Cambridge: Harvard University Press.
- Renyi, A. 1955. „O novej axiomatickej teórii pravdepodobnosti“, Acta Mathematica Academiae Scientiarium Hungaricae 6, 285-335.
- Royall, R. 1997. Štatistické dôkazy: paradigma pravdepodobnosti. New York: Chapman & Hall / CRC.
- Skyrms, B. 1987. "Dynamická koherencia a pravdepodobnostná kinematika". Philosophy of Science 54, 1-20.
- Sober, E. 2002. „Bayesianizmus - jeho pôsobnosť a limity“, Swinburne (2002), 21-38.
- Sphon, W. 1986. "Reprezentácia popperových opatrení", Topoi 5, 69-74.
- Stigler, SM 1982. „Bayesovský inferencia Thomasa Bayesa“, Journal of Royal Statistical Society, séria A 145, 250-258.
- Swinburne, R. 2002. Bayesov teorém. Oxford: Oxford University Press (uverejnená pre Britskú akadémiu).
- Talbot, W. 2001. "Bayesovská epistemológia", Stanfordská encyklopédia filozofie (jeseň 2001, vydanie), Edward N. Zalta (ed.), URL =
- Teller, P. 1976. "Podmienenie, pozorovanie a zmena preferencie", W. Harper a CA Hooker, ed., Základy teórie pravdepodobnosti, štatistický odvod a štatistické teórie vedy. Dordrecht: D. Reidel.
- Williamson, T. 2000. Znalosti a ich limity. Oxford: Oxford University Press.
- Van Fraassen, B. 1999. „Nový argument pre podmienenie“. Topoi 18, 93-96.
Akademické nástroje
![]() |
Ako citovať tento záznam. |
![]() |
Ukážku verzie tohto príspevku vo formáte PDF si môžete pozrieť na stránke Friends of the SEP Society. |
![]() |
Vyhľadajte túto vstupnú tému v projekte Indiana Philosophy Ontology Project (InPhO). |
![]() |
Vylepšená bibliografia tohto záznamu vo PhilPapers s odkazmi na jeho databázu. |
Ďalšie internetové zdroje
- Fitelson, B. 2001. Štúdium v Bayesovskej teórii potvrdzovania, Ph. D. Dizertačná práca, Wisconsinská univerzita. [Predtlač v PDF je k dispozícii online] (stiahnutie 750 000)
- Bayesova originálna esej (vo formáte PDF) (oddelenie štatistiky UCLA / história štatistík)
- Krátka biografia Thomasa Bayesa (University of St. Andrews, MacTutor History of Mathematics Archive)
- Medzinárodná spoločnosť pre Bayesovskú analýzu (ISBA)
Odporúčaná:
Kochen-Speckerova Veta

Vstupná navigácia Obsah vstupu Bibliografia Akademické nástroje Náhľad priateľov PDF Informácie o autorovi a citácii Späť na začiatok Kochen-Speckerova veta Prvýkrát publikované po 11. septembri 2000; podstatná revízia St feb 7, 2018 Kochen-Speckerova veta je dôležitou a jemnou témou v základoch kvantovej mechaniky (QM).