Bayes teori i teknisk diagnostik med exempel. Igenkänningsmetoder. Härledning av Bayes sats

Bayes formel

Bayes sats- en av huvudsatserna i elementär sannolikhetsteorin, som bestämmer sannolikheten för att en händelse inträffar under förhållanden där endast en del av informationen om händelser är känd baserat på observationer. Med hjälp av Bayes formel är det möjligt att räkna om sannolikheten mer exakt, med hänsyn till både tidigare känd information och data från nya observationer.

"Fysisk betydelse" och terminologi

Bayes formel låter dig "ordna om orsak och verkan": med tanke på det kända faktumet av en händelse, beräkna sannolikheten att den orsakades av en given orsak.

Händelser som återspeglar verkan av "orsaker" i detta fall kallas vanligtvis hypoteser, eftersom de är påstås händelserna som ledde till detta. Den ovillkorliga sannolikheten för att hypotesen är sann kallas a priori(hur troligt är orsaken alls), och villkorlig - med hänsyn till händelsen - a posteriori(hur troligt är orsaken visade sig ta hänsyn till händelsedata).

Följd

En viktig konsekvens av Bayes formel är formeln för den totala sannolikheten för en händelse beroende på flera inkonsekventa hypoteser ( och bara från dem!).

- sannolikheten för att en händelse inträffar B, beroende på ett antal hypoteser A i, om graden av tillförlitlighet för dessa hypoteser är känd (till exempel mätt experimentellt);

Härledning av formeln

Om en händelse endast beror på orsaker A i, då om det hände betyder det att en av orsakerna måste ha inträffat, dvs.

Enligt Bayes formel

Genom överföring P(B) till höger får vi det önskade uttrycket.

Skräppostfiltreringsmetod

En metod baserad på Bayes teorem har hittat framgångsrik tillämpning i skräppostfiltrering.

Beskrivning

När du tränar ett filter, för varje ord som påträffas i bokstäver, beräknas och lagras dess "vikt" - sannolikheten att en bokstav med detta ord är skräppost (i det enklaste fallet - enligt den klassiska definitionen av sannolikhet: "uppträder i skräppost / framträdanden totalt”).

När du kontrollerar ett nyligen ankommet brev beräknas sannolikheten att det är spam med hjälp av ovanstående formel för en mängd olika hypoteser. I det här fallet är "hypoteser" ord, och för varje ord är "hypotesens tillförlitlighet" % av detta ord i brevet och "händelsens beroende av hypotesen" P(B | A i) - den tidigare beräknade "vikten" av ordet. Det vill säga, "vikten" av en bokstav i det här fallet är inget annat än den genomsnittliga "vikten" av alla dess ord.

Ett brev klassificeras som "spam" eller "icke-spam" baserat på om dess "vikt" överstiger en viss nivå som specificeras av användaren (vanligtvis 60-80%). Efter att ett beslut fattats om ett brev uppdateras "vikterna" för orden som ingår i det i databasen.

Karakteristisk

Den här metoden är enkel (algoritmerna är elementära), bekväm (låter dig klara dig utan "svarta listor" och liknande konstgjorda tekniker), effektiv (efter träning på ett tillräckligt stort urval, klipper den bort upp till 95-97% av spam, och vid eventuella fel kan den tränas om). I allmänhet finns det allt som tyder på dess utbredda användning, vilket är vad som händer i praktiken - nästan alla moderna skräppostfilter är byggda på dess bas.

Metoden har dock också en grundläggande nackdel: den baserat på antagande, Vad vissa ord är vanligare i skräppost, medan andra är vanligare i vanliga e-postmeddelanden, och är ineffektiv om detta antagande är felaktigt. Men som praxis visar kan inte ens en person upptäcka sådan spam "med ögat" - bara genom att läsa brevet och förstå dess innebörd.

En annan, inte grundläggande, nackdel relaterad till implementeringen är att metoden bara fungerar med text. Med tanke på denna begränsning började spammare infoga reklaminformation i bilden, men texten i brevet saknades eller var meningslös. För att motverka detta måste du använda antingen textigenkänningsverktyg (en "dyr" procedur, använd endast när det är absolut nödvändigt), eller gamla filtreringsmetoder - "svarta listor" och reguljära uttryck (eftersom sådana bokstäver ofta har en stereotyp form).

se även

Anteckningar

Länkar

Litteratur

  • Fågel Kiwi. Pastor Bayes teorem. // Computerra magazine, 24 augusti 2001.
  • Paul Graham. En plan för spam (engelska). // Personlig webbplats för Paul Graham.

Wikimedia Foundation. 2010.

Se vad "Bayes Formula" är i andra ordböcker:

    En formel som har formen: där a1, A2,..., An är inkompatibla händelser, Allmänt schema tillämpning av F. v. g.: om händelse B kan inträffa i olika villkor för vilka n hypoteser A1, A2, ..., An görs med sannolikheter P(A1), ... kända före experimentet. Geologisk uppslagsverk

    Låter dig beräkna sannolikheten för en händelse av intresse genom de villkorade sannolikheterna för denna händelse under antagande av vissa hypoteser, såväl som sannolikheterna för dessa hypoteser. Formulering Låt ett sannolikhetsutrymme ges, och hela gruppen i par... ... Wikipedia

    Gör att du kan beräkna sannolikheten för en händelse av intresse genom de villkorade sannolikheterna för denna händelse under antagandet av vissa hypoteser, såväl som sannolikheterna för dessa hypoteser. Formulering Låt ett sannolikhetsutrymme ges, och en komplett grupp av händelser som... ... Wikipedia

    - (eller Bayes formel) är en av sannolikhetsteorins huvudsatser, som låter dig bestämma sannolikheten för att någon händelse (hypotes) har inträffat i närvaro av endast indirekta bevis (data), som kan vara felaktiga... Wikipedia

    Bayes sats är en av huvudsatserna inom den elementära sannolikhetsteorin, som bestämmer sannolikheten för att en händelse inträffar under förhållanden där endast viss delinformation om händelser är känd baserat på observationer. Med Bayes formel kan du... ... Wikipedia

    Bayes, Thomas Thomas Bayes Pastor Thomas Bayes Födelsedatum: 1702 (1702) Födelseort ... Wikipedia

    Thomas Bayes Reverend Thomas Bayes Födelsedatum: 1702 Födelseort: London ... Wikipedia

    Bayesiansk slutledning är en av metoderna för statistisk slutledning där Bayes formel används för att förfina probabilistiska uppskattningar av sanningen i hypoteser när bevis tas emot. Användningen av Bayesiansk uppdatering är särskilt viktig i... ... Wikipedia

    För att förbättra den här artikeln är det önskvärt?: Hitta och ordna i form av fotnoter länkar till auktoritativa källor som bekräftar det som har skrivits. När du har lagt till fotnoter, ge mer exakta källor. Pere... Wikipedia

    Kommer fångar att förråda varandra, följa sina själviska intressen, eller kommer de att förbli tysta och därigenom minimera total löptid? Prisoner's dilemma (engelska: Prisoner's dilemma, mindre vanligt används är namnet "dilemma ... Wikipedia

Böcker

  • Sannolikhetsteori och matematisk statistik i problem. Mer än 360 uppgifter och övningar, Borzykh D.A.. Den föreslagna manualen innehåller uppgifter olika nivåer svårigheter. Huvudvikten ligger dock på uppgifter med medelhög komplexitet. Detta görs avsiktligt för att uppmuntra eleverna att...

Skicka ditt goda arbete i kunskapsbasen är enkelt. Använd formuläret nedan

Studenter, doktorander, unga forskare som använder kunskapsbasen i sina studier och arbete kommer att vara er mycket tacksamma.

Postat på http://www.allbest.ru/

Introduktion

Bayes-metoden hänvisar till statistiska igenkänningsmetoder, vars främsta fördel är förmågan att samtidigt ta hänsyn till egenskaper av olika fysisk natur. Detta beror på det faktum att alla tecken kännetecknas av dimensionslösa kvantiteter - sannolikheterna för deras förekomst under olika tillstånd i systemet.

Bayes-metoden, på grund av sin enkelhet och effektivitet, rankas speciell plats bland metoderna för teknisk diagnostik, även om det också har nackdelar, till exempel en stor mängd preliminär information, "undertryckande" av sällsynta diagnoser etc. Men i de fall där mängden statistisk information tillåter användning av Bayes-metoden, det är tillrådligt att använda det som en av de mest pålitliga och effektiva metoderna.

1. Grunderna i Bayes-metoden

Metoden bygger på Bayes formel (formel för sannolikhet för hypoteser).

Om det finns en diagnos D i och ett enkelt tecken k j , som inträffar med denna diagnos, då sannolikheten för den gemensamma förekomsten av händelser (närvaron av tillståndet i objektet D i och underteckna k j), bestäms av formeln:

P(D ik j) = P(D i) P (k j/D i) = P (k j) P (D i/ k j). (1.1.)

Från denna jämlikhet följer Bayes formel:

P(D i/ k j) = P(D i) P(k i/D i)/P(k j ) (1.2.)

Det är mycket viktigt att bestämma den exakta betydelsen av alla kvantiteter som ingår i denna formel.

P(D i) --sannolikhet för diagnos D i, fastställt från statistiska data ( tidigare sannolikhet för diagnos). Så, om tidigare undersökt N föremål och N i föremål hade ett tillstånd D i, Den där

P(D i) = N i/N. (1.3.)

P (k j/D i k j för objekt med stat D i.

Om bland N i föremål med en diagnos D i, y N I j en skylt dök upp k j , sedan Bayes korrelationsprobabilistiska

P(k j/D i) = N I j/N i. (1.4.)

P(k j) --sannolikhet för förekomst av ett tecken k j i alla objekt, oavsett tillstånd (diagnos) för objektet. Låt från det totala antalet N objekt tecken k j hittades i N j föremål alltså

P(k j ) = N j/N. (1.5.)

För att fastställa en diagnos, en speciell beräkning P(kj ) inte nödvändig. Som kommer att framgå av det följande , värden P(D i)Och P (k j / D i), känd för alla möjliga tillstånd, bestäm värdet P(k j ).

I jämställdhet P (D i/k j) - sannolikhet för diagnos D i sedan det blivit känt att föremålet i fråga har egenskapen k j (a posteriori troTdiagnos).

2 . Generaliserad Bayes formel

Denna formel gäller för det fall då undersökningen utförs enligt en uppsättning tecken TILL , inklusive skyltar k 1 , k 2 , ..., k v . Var och en av tecknen k j Det har m j rankas ( k j jag, k j 2 , ..., k js, ...,). Som ett resultat av undersökningen blir implementeringen av egenskapen känd

k j * = k js (1.5.)

och hela komplexet av tecken K*. Index *, som tidigare betyder den specifika betydelsen (förverkligandet) av attributet. Bayes formel för en uppsättning funktioner har formen

P(D i/ TILL * )= P(D i)P(TILL */D i)/P(TILL * )(i = 1, 2, ..., n), (1.6.)

Var P (D i/ TILL * ) --sannolikhet för diagnos D i efter att resultatet av undersökningen på en uppsättning tecken blev känt TILL , P (D i) --preliminär sannolikhet för diagnos D i (enligt tidigare statistik).

Formel (1.6.) gäller för alla n möjliga tillstånd (diagnoser) i systemet. Det antas att systemet endast är i ett av de angivna tillstånden och därför

I praktiska problem tillåts ofta möjligheten att det finns flera tillstånd A1, ....., Ar, och några av dem kan förekomma i kombination med varandra.

P(TILL */ D i) = P(k 1 */ D i)P (k 2 */ k 1 * D i)...P (k v */ k l* ...k* v- 1 D i), (1.8.)

Var k j * = k js --kategori av egenskapen som avslöjas som ett resultat av undersökningen. För diagnostiskt oberoende tecken

P (TILL */ D i) = P (k 1 */ D i) P (k 2 */ D i)... P (k v * / D i). (1.9.)

I de flesta praktiska problem, särskilt när stort antal egenskaper kan man acceptera villkoret om egenskapers oberoende även om det finns betydande samband mellan dem.

Sannolikhet för utseende av ett komplex av teckenTILL *

P(TILL *)= P(D s)P(TILL */D s) . (1.10.)

Den generaliserade Bayes-formeln kan skrivas på följande sätt :

P(D i/ K * ) (1.11.)

Var P (TILL */ D i)bestäms av jämlikhet (1.8.) eller (1.9.). Av relation (1.11.) följer

P(D i/ TILL *)=l , (1.12.)

vilket naturligtvis bör vara fallet, eftersom en av diagnoserna nödvändigtvis realiseras, och realiseringen av två diagnoser samtidigt är omöjlig. Vänligen notera att nämnare av Bayes formel för all diagnostikOsamtalet är detsamma. Detta låter dig först avgöra sannolikhet för samtidig förekomst e nia i diagnosen och denna implementering av en uppsättning funktioner

P(D iTILL *) = P(D i)P(TILL */D i) (1.13.)

och då posterior sannolikhet för diagnos

P (D i/TILL *) = P(D iTILL *)/P(D sTILL *). (1.14.)

Observera att det ibland är tillrådligt att använda preliminär logaritm med formeln (1.11.), eftersom uttrycket (1.9.) innehåller produkter av små kvantiteter.

Om genomförandet av en viss uppsättning funktioner TILL * är bestämmande för diagnos D sid, då förekommer inte detta komplex i andra diagnoser:

Sedan, i kraft av jämlikhet (1.11.)

Den deterministiska diagnosens logik är således ett specialfall av probabilistisk logik. Bayes formel kan också användas i fallet när några av funktionerna har en diskret fördelning och den andra delen har en kontinuerlig fördelning. För kontinuerlig distribution används distributionstätheter. Men i beräkningsplanen är denna skillnad i egenskaper obetydlig om definitionen av en kontinuerlig kurva utförs med hjälp av en uppsättning diskreta värden.

3 . Diagnostisk matris

För att bestämma sannolikheten för diagnoser med Bayes-metoden är det nödvändigt att skapa en diagnostisk matris (tabell 1.1), som är bildad på grundval av preliminärt statistiskt material. Denna tabell innehåller sannolikheterna för karaktärskategorier för olika diagnoser.

Tabell 1.1

Diagnostisk matris i Bayes-metoden

Diagnos D i

Sign k j

k 1

k 2

P(k 11 /D i)

P(k 12 /D i)

P(k 21 /D i)

P(k 22 /D i)

P(k 23 /D i)

P(k 24 /D i)

P(k 31 /D i)

P(k 32 /D i)

D 1

D 2

Om tecknen är tvåsiffriga (enkla tecken "ja - nej"), räcker det i tabellen att ange sannolikheten för att tecknet visas P(k i/D i). Sannolikhet för saknad funktion R ( /D,-) = 1 - P(k i/D i).

Det är dock mer bekvämt att använda en enhetlig form, förutsatt att till exempel ett tvåsiffrigt tecken R (k j/D i) = R (k i 1 /D i); R ( /D,) = P(k i 2 /D i).

Anteckna det P(k js/Di) = 1, där T, -- antal attributsiffror k j. Summan av sannolikheterna för alla möjliga implementeringar av attributet är lika med ett.

Den diagnostiska matrisen inkluderar a priori sannolikheter för diagnoser. Inlärningsprocessen i Bayes-metoden består i att bilda en diagnostisk matris. Det är viktigt att tillhandahålla möjligheten att förtydliga tabellen under den diagnostiska processen. För att göra detta bör inte bara värden lagras i datorns minne P(k js/Di), men även följande kvantiteter: N -- Totala numret objekt som används för att kompilera den diagnostiska matrisen; N i D i; N I j -- Antal objekt med diagnos D i, granskas utifrån k j. Om det kommer ett nytt föremål med diagnos D m, sedan justeras de tidigare a priori sannolikheterna för diagnoser.

Därefter introduceras korrigeringar av funktionernas sannolikheter. Låt det nya objektet med diagnosen D m urladdning upptäckt r skylt k j. Sedan, för ytterligare diagnostik, accepteras nya värden för funktionens sannolikhetsintervall k j vid diagnos D m:

Villkorliga sannolikheter för tecken för andra diagnoser kräver ingen justering.

Slutsats

I Bayes-metoden, ett objekt med ett komplex av funktioner TILL * avser diagnosen med högst (posterior) sannolikhet

K* D i, Om P(D i/ K *) > P(D j/ K *) (j = 1, 2,..., n; jag? j). (1.17.)

Symbol , Använd i funktionell analys, betyder att tillhöra en uppsättning. Villkor (1.17.) indikerar att ett objekt som har en given implementering av ett komplex av egenskaper TILL * eller kort och gott genomförande TILL * hör till diagnosen (tillståndet) D i. Regel (1.17.) förtydligas vanligtvis genom att införa ett tröskelvärde för sannolikheten för diagnos:

P(D i/ K *) ? P i, (1.18.)

Var P i. -- förvalt igenkänningsnivå för diagnos D i. I det här fallet är sannolikheten för den närmast konkurrerande diagnosen inte högre än 1 - P i. Vanligtvis accepteras P i? 0,9. Givet att

P(D i/ K *)

i (1.19.)

något beslut om diagnos fattas inte (vägran att erkänna) och ytterligare information krävs.

Beslutsprocessen i Bayes-metoden vid beräkning på dator sker ganska snabbt. Till exempel att göra en diagnos för 24 tillstånd med 80 flersiffriga tecken tar bara några minuter på en dator med en hastighet på 10 - 20 tusen operationer per sekund.

Som antytts har Bayes-metoden vissa nackdelar, till exempel fel i att känna igen sällsynta diagnoser. I praktiska beräkningar är det tillrådligt att utföra diagnostik för fallet med lika sannolika diagnoser, sätta

P(D i) = l/n (1.20.)

Då kommer diagnosen att ha det största posteriora sannolikhetsvärdet D i, för vilka R (K* /D i) maximal:

K* D i, Om P(K* /D i) > P(K* /D j) (j = 1, 2,..., n; jag? j). (1.21.)

Med andra ord ställs en diagnos D i om denna uppsättning symtom är vanligare under diagnosen D iän med andra diagnoser. Denna beslutsregel motsvarar metoden för maximal sannolikhet. Det följer av det föregående att denna metod är ett specialfall av Bayes-metoden med samma tidigare sannolikheter för diagnoser. I maximum likelihood-metoden har "vanliga" och "sällsynta" diagnoser lika rättigheter.

Lista över använda källor

1. Gorelik, A. L. Erkännandemetoder [Text]: lärobok. manual för universitet / A. L. Gorelik, V. A. Skripkin. - M.: Högre. skola, 2004. - 261 sid.

2. Sapozhnikov, V.V. Fundamentals of teknisk diagnostik [Text]: lärobok. ersättning / V.V. Sapozhnikov, Vl. V. Sapozhnikov. - M.: Route, 2004. - 318 sid.

3. Serdakov, A. S. Automatisk kontroll och teknisk diagnostik [Text] / A. S. Serdakov. - Kiev: Teknik, 1971. - 244 sid.

4. Stetsyuk. A. E. "Grundläggande av teknisk diagnostik. Teori om erkännande": lärobok. ersättning / A. E. Stetsyuk, Ya. - Khabarovsk: Förlag DVGUPS, 2012. - 69 sid.

Postat på Allbest.ru

Liknande dokument

    Studie av de mest typiska algoritmerna för att lösa problem av probabilistisk karaktär. Bekantskap med kombinatorikens element, urnteori, Bayes formel, metoder för att hitta diskreta, kontinuerliga slumpvariabler. Övervägande av grunderna i händelsealgebra.

    utbildningsmanual, tillagd 2010-06-05

    Bestämning och bedömning av sannolikheten för att en given händelse inträffar. Metodik för att lösa problemet med hjälp av satsen addition och multiplikation, formler full sannolikhet eller Bayesian. Tillämpning av Bernoullis schema för att lösa problem. Beräkning av kvadratavvikelse.

    praktiskt arbete, tillagt 2015-08-23

    Statistisk, axiomatisk och klassisk definition av sannolikhet. Diskreta slumpvariabler. Gränssatser Laplace och Poisson. Sannolikhetsfördelningsfunktion för multivariata slumpvariabler. Bayes formel. Punktuppskattning av varians.

    fuskblad, tillagt 2015-04-05

    Beräkning av sannolikheten för utebliven återbetalning av ett lån av juridiska och en individ, med Bayes formel. Beräkning av provvarians, dess metodik, huvudstadier. Bestämma sannolikheten för att en vit boll ska falla av tre slumpmässigt, vilket motiverar resultatet.

    test, tillagt 2014-11-02

    Tillämpning av sannolikhetsteorins formler och lagar för att lösa problem. Bayes formel, som låter dig bestämma sannolikheten för en händelse, förutsatt att en annan händelse som är statistiskt beroende av den har inträffat. Centrala gränsvärdessatsen.

    kursarbete, tillagt 2015-04-11

    Ett experiment med ett slumpmässigt utfall. Statistisk stabilitet. Sannolikhetsbegreppet. Algebra av händelser. Principen om dualitet för händelser. Villkorliga sannolikheter. Formler för addition och multiplikation av sannolikheter. Bayes formel. Utrymme av elementära händelser.

    abstrakt, tillagt 2007-03-12

    Bestämma sannolikheten att få minst 4 poäng på tärningar när man kastar den en gång. Bestämma sannolikheten för att tillverka en del (om en del som tas slumpmässigt av en montör visar sig vara Perfekt kvalite) den första växten att använda Bayes formel.

    test, tillagt 2012-05-29

    Tillförlitlighetsindikatorer som indikatorer på tillförlitligheten hos icke-reparerbara föremål. Klassisk och geometrisk definition av sannolikhet. Frekvensen av en slumpmässig händelse och den "statistiska definitionen" av sannolikhet. Sannolikhetsadditions- och multiplikationssatser.

    kursarbete, tillagd 2011-11-18

    Diskreta slumpvariabler och deras fördelningar. Total sannolikhetsformel och Bayes formel. Allmänna egenskaper hos matematiska förväntningar. Dispersion slumpvariabel. Fördelningsfunktion för en stokastisk variabel. Klassisk definition av sannolikhet.

    test, tillagt 2010-12-13

    Matematiska modeller av fenomen eller processer. Konvergens av den enkla iterationsmetoden. A posteriori feluppskattning. Rotationsmetod linjära system. Kontroll av noggrannhet och ungefärlig lösning inom ramen för den direkta metoden. Avslappningsmetod och Gaussmetoden.

Parameternamn Menande
Artikelns ämne: Bayes metod
Rubrik (tematisk kategori) Teknologier

Ställa in tekniska diagnostiska uppgifter

Huvudinriktningar för teknisk diagnostik

Grunderna i teknisk diagnostik

AVSNITT nr 5

Definitioner. Termen "diagnostik" kommer från grekiska ordʼʼdiagnosʼʼ, vilket betyder erkännande, beslutsamhet.

Under den diagnostiska processen fastställs en diagnos, ᴛ.ᴇ. patientens tillstånd (medicinsk diagnostik) eller det tekniska systemets tillstånd (teknisk diagnostik) bestäms.

Teknisk diagnostik brukar kallas vetenskapen om att känna igen tillståndet hos ett tekniskt system.

Mål för teknisk diagnostik. Låt oss kort överväga huvudinnehållet i teknisk diagnostik. Teknisk diagnostik studerar metoder för att erhålla och utvärdera diagnostisk information, diagnostiska modeller och beslutsalgoritmer. Syftet med teknisk diagnostik är att öka tillförlitligheten och livslängden för tekniska system.

Som bekant är den viktigaste indikatorn på tillförlitlighet frånvaron av fel under driften (driften) av ett tekniskt system. Fel på en flygplansmotor under flygförhållanden, fartygsmaskineri under ett fartygs resa eller kraftverk som arbetar under belastning kan leda till allvarliga konsekvenser.

Teknisk diagnostik, tack vare tidig upptäckt av defekter och felfunktioner, gör att sådana fel kan elimineras under processen Underhåll, vilket ökar driftsäkerheten och effektiviteten, och gör det också möjligt att driva tekniska system för kritiska ändamål enligt deras tillstånd.

I praktiken bestäms livslängden för sådana system av de "svagaste" kopiorna av produkter. Under tillståndsbaserad drift körs varje prov till sitt begränsande tillstånd i enlighet med rekommendationerna från det tekniska diagnossystemet. Tillståndsbaserad drift kan ge fördelar motsvarande kostnaden för 30 % av den totala fordonsflottan.

Huvuduppgifterna för teknisk diagnostik. Teknisk diagnostik löser ett brett spektrum av problem, av vilka många är relaterade till problemen inom andra vetenskapliga discipliner. Huvuduppgiften för teknisk diagnostik är att känna igen tillståndet för ett tekniskt system under förhållanden med begränsad information.

Teknisk diagnostik kallas ibland in-place diagnostik, det vill säga diagnostik som utförs utan att demontera produkten. Statlig analys utförs under driftsförhållanden där det är extremt svårt att få information. Ofta är det inte möjligt att dra en entydig slutsats från tillgänglig information och statistiska metoder måste användas.

Den allmänna teorin om mönsterigenkänning bör betraktas som den teoretiska grunden för att lösa huvudproblemet med teknisk diagnostik. Denna teori, som utgör en viktig del av teknisk kybernetik, handlar om igenkänning av bilder av vilken karaktär som helst (geometrisk, ljud, etc.), maskinigenkänning av tal, tryckta och handskrivna texter, etc. Teknisk diagnostik studerar igenkänningsalgoritmer som tillämpas på diagnostiska problem, som vanligtvis kan betraktas som klassificeringsproblem.

Igenkänningsalgoritmer inom teknisk diagnostik är delvis baserade på diagnostiska modeller som upprättar en koppling mellan tillstånden i ett tekniskt system och deras avbildningar i utrymmet för diagnostiska signaler. En viktig del av erkännandeproblemet är beslutsregler (beslutsregler).

Att lösa ett diagnostiskt problem (klassificering av en produkt som funktionsduglig eller felaktig) är alltid förknippad med risk för ett falskt larm eller att missa ett mål. För att fatta ett välgrundat beslut är det tillrådligt att använda metoder för statistisk beslutsteori, utvecklade för första gången i radar.

Att lösa tekniska diagnostiska problem är alltid förknippat med att förutsäga tillförlitlighet för nästa driftsperiod (tills nästa tekniska inspektion). Här måste beslut baseras på felmodeller studerade inom reliabilitetsteorin.

Det andra viktiga området för teknisk diagnostik är teorin om kontrollerbarhet. Kontrollerbarhet kallas vanligtvis egenskapen hos en produkt för att ge en tillförlitlig bedömning av dess

tekniskt skick och tidig upptäckt av fel och fel. Spårbarhet skapas av produktens design och accepterat system teknisk diagnostik.

En huvuduppgift för teorin om kontrollkapacitet är studiet av medel och metoder för att erhålla diagnostisk information. Komplexa tekniska system använder automatisk tillståndsövervakning, vilket innebär att diagnostisk information bearbetas och styrsignaler genereras. Metoder för att designa automatiserade styrsystem utgör ett av områdena i teorin om styrbarhet. Slutligen är mycket viktiga uppgifter för teorin om kontrollerbarhet förknippade med utvecklingen av felsökningsalgoritmer, utvecklingen av diagnostiska tester och minimering av processen för att fastställa en diagnos.

På grund av det faktum att teknisk diagnostik från början endast utvecklades för radioelektroniska system, identifierar många författare teorin om teknisk diagnostik med teorin om styrbarhet (feldetektering och övervakning), vilket naturligtvis begränsar tillämpningsområdet för teknisk diagnostik.

Struktur för teknisk diagnostik. I fig. Figur 5.1 visar strukturen för teknisk diagnostik. Den kännetecknas av två genomträngande och sammanlänkade riktningar: teorin om igenkänning och teorin om kontrollförmåga. Igenkänningsteori innehåller avsnitt relaterade till konstruktionen av igenkänningsalgoritmer, beslutsregler och diagnostiska modeller. Teorin om styrbarhet innefattar utveckling av verktyg och metoder för att få diagnostisk information, automatiserad styrning och felsökning. Teknisk diagnostik bör betraktas som en del av den allmänna teorin om tillförlitlighet.

Ris. 5.1. Struktur för teknisk diagnostik

Inledande kommentarer. Låt det vara nödvändigt att bestämma tillståndet för splineanslutningen av växellådans axlar under driftsförhållanden. Vid överdrivet slitage på splines uppstår distorsion och utmattningsskador. Direkt inspektion av splines är omöjlig, eftersom det kräver demontering av växellådan, d.v.s. stoppa driften. Ett fel på splineanslutningen kan påverka växellådans vibrationsspektrum, akustiska vibrationer, järnhalt i oljan och andra parametrar.

Den tekniska diagnostikens uppgift är att bestämma graden av splineförslitning (djupet på det förstörda ytskiktet) baserat på mätdata för ett antal indirekta parametrar. Som sagt, en av viktiga funktioner teknisk diagnostik är erkännande under förhållanden med begränsad information, när det är nödvändigt att vägledas av vissa tekniker och regler för att fatta ett välgrundat beslut.

Systemets tillstånd beskrivs av en uppsättning (uppsättning) av dess definierande parametrar (egenskaper). Naturligtvis bör uppsättningen av definierande parametrar (funktioner) vara annorlunda, i första hand i samband med själva igenkänningsuppgiften. Till exempel, för att känna igen tillståndet för en motorsplineanslutning, räcker det med en viss grupp parametrar, men den måste kompletteras om andra delar också diagnostiseras.

Systemtillståndsigenkänning- tilldelning av systemtillståndet till en av de möjliga klasserna (diagnoser). Antalet diagnoser (klasser, typiska tillstånd, standarder) beror på problemets egenskaper och studiens mål.

Det är ofta nödvändigt att välja en av två diagnoser (differentialdiagnos eller dikotomi); till exempel "felaktigt tillstånd" och "feltillstånd". I andra fall är det ytterst viktigt att karakterisera feltillståndet mer i detalj, till exempel ökat slitage av splines, ökad vibration av blad etc. Vid de flesta tekniska diagnosuppgifter fastställs diagnoser (klasser) i förväg och i dessa förhållanden kallas igenkänningsuppgiften ofta en klassificeringsuppgift.

Eftersom teknisk diagnostik är förknippad med bearbetning av en stor mängd information, sker beslutsfattande (igenkänning) ofta med hjälp av elektroniska datorer(DATOR).

Uppsättningen av sekventiella åtgärder i igenkänningsprocessen kallas vanligtvis igenkänningsalgoritm. En väsentlig del av erkännandeprocessen är val av parametrar, som beskriver systemets tillstånd. De måste vara tillräckligt informativa för att, givet det valda antalet diagnoser, processen för separation (igenkänning) kan utföras.

Matematisk formulering av problemet. I diagnostiska uppgifter beskrivs ofta systemets tillstånd med hjälp av en uppsättning tecken

K=(k l , k 2 ,..., k j,..., kv), (5.1)

Var k j- ett tecken som har m j utsläpp.

Låt till exempel ett tecken k jär ett tresiffrigt tecken ( m j= 3), som karakteriserar gastemperaturen bakom turbinen: reducerad, normal, ökad. Varje siffra (intervall) i tecknet k j betecknas med k js till exempel ökad temperatur bakom turbinen k j h. Faktum är att det observerade tillståndet motsvarar en viss implementering av egenskapen, vilket indikeras av den övre skriften *. Till exempel, vid förhöjda temperaturer, genomförandet av egenskapen k*j = k j h.

I allmänhet motsvarar varje instans av systemet någon implementering av en uppsättning funktioner:

K* = (k 1 * , k 2 * ,..., k j *,..., kv*). (5.2)

I många igenkänningsalgoritmer är det bekvämt att karakterisera systemet med parametrar x j, bildande v- dimensionell vektor eller punkt vid v-dimensionellt utrymme:

X =(x jag, x 2 , x j,,xv). (5.3)

I de flesta fall parametrarna x j ha en kontinuerlig distribution. Till exempel, låt x j- en parameter som uttrycker temperaturen bakom turbinen. Låt oss anta att överensstämmelsen mellan parametern x j(°C) och tresiffrigt tecken k jär detta:

< 450 till j l

450 - 550 till j 2

> 500 till j 3

I i det här fallet med hjälp av tecknet k j en diskret beskrivning erhålls, medan parametern x j ger en fortlöpande beskrivning. Observera att med en kontinuerlig beskrivning krävs vanligtvis en mycket större mängd preliminär information, men beskrivningen är mer korrekt. Om emellertid de statistiska lagarna för fördelningen av parametern är kända, reduceras den erforderliga mängden preliminär information.

Det är tydligt från det föregående att det inte finns några grundläggande skillnader när man beskriver ett system med funktioner eller parametrar, och båda typerna av beskrivning kommer att användas i framtiden.

Som nämnts, i teknisk diagnostik problem med de möjliga tillstånden i systemet - diagnoser D i- anses kända.

Det finns två grundläggande synsätt på igenkänningsproblemet: probabilistisk och deterministisk. Formulering av problemet med probabilistiska igenkänningsmetoder är detta fallet. Det finns ett system som är i ett av de slumpmässiga tillstånden D i. En uppsättning tecken (parametrar) är kända, som var och en karakteriserar systemets tillstånd med en viss sannolikhet. Det krävs att man konstruerar en beslutsregel med hjälp av vilken den presenterade (diagnostiserade) uppsättningen tecken skulle tilldelas ett av de möjliga tillstånden (diagnoser). Det är också lämpligt att utvärdera tillförlitligheten beslut fattat och graden av risk för ett felaktigt beslut.

Med deterministiska igenkänningsmetoder är det bekvämt att formulera problemet i geometriskt språk. Om systemet karakteriseras v-dimensionell vektor X , då är vilket tillstånd som helst i systemet en punkt i det v-dimensionella utrymmet av parametrar (funktioner). Det antas att diagnos D motsvarar någon region av det betraktade funktionsutrymmet. Det krävs att hitta en beslutsregel enligt vilken den presenterade vektorn X * (objektet som diagnostiseras) kommer att tilldelas ett specifikt område för diagnos. Uppgiften handlar alltså om att dela upp funktionsutrymmet i diagnostiska områden.

Med ett deterministiskt tillvägagångssätt brukar diagnosdomänerna betraktas som ʼʼicke-överlappandeʼʼ, ᴛ.ᴇ. sannolikheten för en diagnos (i det område där punkten faller) är lika med en, sannolikheten för andra är lika med noll. På samma sätt antas det att varje symptom antingen är närvarande med en given diagnos eller frånvarande.

Probabilistiska och deterministiska synsätt har inga grundläggande skillnader. Probabilistiska metoder är mer generella, men de kräver ofta en mycket större mängd preliminär information. Deterministiska tillvägagångssätt beskriver mer kortfattat de väsentliga aspekterna av igenkänningsprocessen, är mindre beroende av redundant information av lågt värde och är mer förenliga med logiken i mänskligt tänkande.

Följande kapitel beskriver de grundläggande igenkänningsalgoritmerna för tekniska diagnostiska problem.

Bland tekniska diagnostiska metoder upptar metoden baserad på den generaliserade Bayes-formeln en speciell plats på grund av dess enkelhet och effektivitet.

Naturligtvis har Bayes-metoden nackdelar: stor volym preliminär information, ”undertryckande” av sällsynta diagnoser m.m.
Upplagt på ref.rf
Dessutom, i de fall där mängden statistiska data tillåter användning av Bayes-metoden, är det tillrådligt att använda den som en av de mest tillförlitliga och effektiva metoderna.

Grunderna i metoden. Metoden bygger på en enkel Bayes formel. Om det finns en diagnos D i och ett enkelt tecken k j , som inträffar med denna diagnos, då sannolikheten för den gemensamma förekomsten av händelser (närvaron av tillståndet i objektet D i och underteckna k j)

P (D i k j) = P (D i) P ( k j/D i) = P ( k j)P(Di/ k j). (5.4)

Bayes formel följer av denna likhet (se kapitel 11)

P(D i / k j) = P(D i) P( k i /D i)/P( k j) (5.5)

Det är mycket viktigt att bestämma den exakta betydelsen av alla kvantiteter som ingår i denna formel.

P(D i) - sannolikhet för diagnos D i, fastställt från statistiska data ( tidigare sannolikhet för diagnos). Så, om tidigare undersökt N föremål och N i föremål hade ett tillstånd D i, Den där

P(D i) = N i/N. (5.6)

P(k j/D i) - k j för objekt med stat D i. I fall bland N i föremål med en diagnos D i, y N ij en skylt dök upp k j , Den där

P(k j/D i) = N ij /N i. (5.7)

P(k j) - sannolikheten för att ett tecken inträffar k j i alla objekt, oavsett tillstånd (diagnos) för objektet. Låt det totala antalet N objekt tecken k j var upptäckt N j föremål alltså

P( k j ) = N j/N. (5.8)

För att fastställa en diagnos, en speciell beräkning P(kj) inte nödvändig. Som kommer att framgå av det följande , värden P(D i)Och P(k j/ D i), känd för alla möjliga tillstånd, bestäm värdet P(k j).

Jämställdhet (3.2) P(D i/k j)- sannolikhet för diagnos D i sedan det blivit känt att föremålet i fråga har egenskapen k j (posterior sannolikhet för diagnos).

Generaliserad Bayes formel. Denna formel gäller för det fall då undersökningen utförs enligt en uppsättning tecken TILL, inklusive skyltar k 1 , k 2 , ..., kv. Var och en av tecknen k j Det har m j rankas ( k j jag, k j 2 , ..., k js, ..., ). Som ett resultat av undersökningen blir implementeringen av egenskapen känd

k j *= k js(5.9)

och hela komplexet av tecken K*. Index *, som tidigare betyder den specifika betydelsen (förverkligandet) av attributet. Bayes formel för ett komplex av funktioner har formen

P(D i/TILL* )= P(D i)P(TILL */D i)/P(TILL* )(i= 1, 2, ..., n), (5.10)

Var P(D i/TILL* ) - sannolikhet för diagnos D i efter att resultatet av undersökningen på en uppsättning tecken blev känt TILL, P(D i) - preliminär sannolikhet för diagnos D i(enligt tidigare statistik).

Formel (5.10) gäller för alla n möjliga tillstånd (diagnoser) i systemet. Det antas att systemet endast är i ett av de angivna tillstånden och därför

I praktiska problem tillåts ofta möjligheten att det finns flera stater A 1 , ..., A r, och några av dem kan förekomma i kombination med varandra. Sedan, som olika diagnoser D i individuella förhållanden bör övervägas D 1 = A 1 , ..., D r= A r och deras kombinationer D r +1 = A 1 ^ A 2, ... osv.

Låt oss gå vidare till definitionen P(TILL*/ D i). Om komplexet av tecken består av v tecken alltså

P(TILL*/ D i) = P( k 1 */ D i)P(k 2 */k 1* D i)...P(kv*/k l*...k*v- 1 D i), (5.12)

Var k j* = k js- kategori av ett tecken som avslöjas som ett resultat av undersökningen. För diagnostiskt oberoende tecken

P(TILL*/ D i) = P(k 1 */ D i) P(k 2 */ D i)... P(kv*/ D i). (5.13)

I de flesta praktiska problem, särskilt med ett stort antal funktioner, är det möjligt att acceptera villkoret av oberoende av funktioner även i närvaro av betydande korrelationer mellan dem.

Sannolikhet för utseende av ett komplex av tecken TILL*

P(TILL *)= P(D s)P(TILL */D s). (5.14)

Den generaliserade Bayes-formeln ska skrivas så här :

P(D i/K* ) (5.15)

Var P(TILL*/ D i)bestäms av jämlikhet (5.12) eller (5.13). Av relationer (5.15) följer

P(D i/TILL *)=l , (5.16)

vilket naturligtvis bör vara fallet, eftersom en av diagnoserna nödvändigtvis realiseras, och realiseringen av två diagnoser samtidigt är omöjlig.

Det bör noteras att nämnaren för Bayes formel är densamma för alla diagnoser. Detta gör att vi först kan bestämma sannolikheterna för samtidig förekomst i diagnos och givet genomförande av ett komplex av tecken

P(D iTILL *) = P(D i)P(TILL */D i) (5.17)

och sedan den bakre sannolikheten för diagnos

P(D i/TILL *) = P(D i TILL *)/P(D s TILL *). (5.18)

Observera att det ibland är tillrådligt att använda preliminär logaritm med formeln (5.15), eftersom uttrycket (5.13) innehåller produkter av små kvantiteter.

Om genomförandet av en viss uppsättning funktioner TILL * är bestämmande för diagnos Dp, då förekommer inte detta komplex i andra diagnoser:

Sedan, i kraft av jämlikhet (5.15)

(5.19)

Den deterministiska diagnosens logik är dock ett specialfall av probabilistisk logik. Bayes formel kan också användas i fallet när några av funktionerna har en diskret fördelning och den andra delen har en kontinuerlig fördelning. Det är värt att säga att för kontinuerlig distribution används distributionstätheter. Dessutom, i beräkningsplanen, är den specificerade skillnaden i egenskaper obetydlig om den kontinuerliga kurvan anges med en uppsättning diskreta värden.

Diagnostisk matris. För att bestämma sannolikheten för diagnoser med den Bayesianska metoden är det extremt viktigt att skapa en diagnostisk matris (tabell 5.1), som är bildad på basis av preliminärt statistiskt material. Denna tabell innehåller sannolikheterna för karaktärskategorier för olika diagnoser.

Tabell 5.1

Diagnostisk matris i Bayes-metoden

Diagnos D i Sign k j P(Di)
k 1 k 2 k 3
P(k 11 /D i) P(k 12 /D i) P(k 13 /D i) P(k 21 /D i) P(k 22 /D i) P(k 23 /D i) P(k 24 /D i) P(k 31 /D i) P(k 32 /D i)
D 1 0,8 0,2 0,1 0,1 0,6 0,2 0,2 0,8 0,3
D 2 0,1 0,7 0,2 0,3 0,7 0,1 0,9 0,1

Om tecknen är tvåsiffriga (enkla tecken "ja - nej"), räcker det i tabellen för att ange sannolikheten för att tecknet uppstår P (ki/Di). Sannolikhet för saknad funktion R( /D,-) = 1 - P (ki/Di).

I det här fallet är det mer bekvämt att använda en enhetlig form, förutsatt att till exempel ett tvåsiffrigt attribut R (k j/D i)= R(k i 1 /D i); R( /D,) = P (k i 2 /D i).

Anteckna det P(k js/Di)= 1, där T, - antal attributsiffror k j. Summan av sannolikheterna för alla möjliga implementeringar av attributet är lika med ett.

Den diagnostiska matrisen inkluderar a priori sannolikheter för diagnoser. Inlärningsprocessen i Bayes-metoden består i att bilda en diagnostisk matris. Det är viktigt att tillhandahålla möjligheten att förtydliga tabellen under den diagnostiska processen. För att göra detta bör inte bara värden lagras i datorns minne P(k js/Di), men även följande kvantiteter: N- det totala antalet objekt som används för att kompilera den diagnostiska matrisen; N i- antal objekt med diagnos D i; N ij- antal objekt med diagnos D jag, granskas utifrån k j. Om det kommer ett nytt föremål med diagnos , så justeras de tidigare a priori sannolikheterna för diagnoser enligt följande:

(5.20)

Därefter introduceras korrigeringar av funktionernas sannolikheter. Låt det nya objektet med diagnosen urladdning upptäckt r skylt k j. I detta fall, för ytterligare diagnostik, accepteras nya värden av sannolikhetsintervallen för egenskapen k j vid diagnos :

(5.21)

Villkorliga sannolikheter för tecken för andra diagnoser kräver ingen justering.

Exempel. Låt oss förklara Bayes-metoden. Låt två tecken kontrolleras när du observerar en gasturbinmotor: k 1 - ökning av gastemperaturen bakom turbinen med mer än 50 °C och k 2- öka tiden för att nå maximal hastighet med mer än 5 s. Låt oss anta att för denna typ av motor är utseendet på dessa symtom associerat antingen med ett fel i bränsleregulatorn (tillstånd D 1 ,), eller med en ökning av det radiella spelet i turbinen (tillstånd D 2).

När motorn är i normalt skick (skick D 3) tecken k 1 inte observeras, utan ett tecken k 2 observeras i 5 % av fallen. Baserat på statistiska data är det känt att 80 % av motorerna har en livslängd i normalt skick, 5 % av motorerna har ett tillstånd D 1 och 15% - skick D2. Det är också känt att skylten k 1 förekommer i tillståndet D 1 på 20 %, och vid tillstånd D 2 i 40 % av fallen; skylt k 2 i skick D 1 förekommer hos 30 % och i tillståndet D 2- i 50 % av fallen. Låt oss sammanfatta dessa data i en diagnostisk tabell (tabell 5.2).

Låt oss först hitta sannolikheterna för motortillstånd när båda tecknen upptäcks k 1 och k 2 . För att göra detta, med tanke på att tecknen är oberoende, tillämpar vi formel (5.15).

Ange sannolikhet

På samma sätt får vi P (D2/k1k2) = 0,91; P (D 3 /k 1 k 2)= 0.

Låt oss bestämma sannolikheten för motorförhållanden om undersökningen visade att det inte finns någon temperaturökning (tecken k 1 2 skiljer sig från noll, eftersom egenskaperna i fråga inte är avgörande för dem. Av genomförda beräkningar kan konstateras att om det finns tecken k 1 Och k 2 i motorn med sannolikhet 0,91 finns ett tillstånd D1,ᴛ.ᴇ. ökning av radiellt spelrum. I frånvaro av båda tecknen är det mest sannolika tillståndet normalt (sannolikhet 0,92). I avsaknad av tecken k 1 och närvaron av ett tecken k 2 ange sannolikheter D 2 Och D 3 ungefär samma (0,46 och 0,41) och ytterligare undersökningar krävs för att klargöra motorns tillstånd.

Tabell 5.2

Funktionssannolikheter och tidigare tillståndssannolikheter

D i P(k 1 /D i) P(k 2 /D i) P(Di)
D 1 0,2 0,3 0,05
D 2 0,4 0,5 0,15
D 3 0,0 0,05 0,80

Avgörande regel- den regel enligt vilken beslut om diagnos fattas. I Bayes-metoden, ett objekt med ett komplex av funktioner TILL * avser diagnosen med högst (posterior) sannolikhet

K*D i,Om P(D i / K*) > P(D j / K*) (j = 1, 2,..., n; jag ≠ j). (5.22)

Symbol , som används i funktionsanalys, betyder att tillhöra en uppsättning. Villkor (5.22) indikerar att ett objekt har en given implementering av ett komplex av funktioner TILL * eller kort och gott genomförande TILL * hör till diagnosen (tillståndet) D i. Regel (5.22) förfinas vanligtvis genom att införa ett tröskelvärde för sannolikheten för diagnos:

P (D i /K *) P i, (5.23)

Var Pi.- förvalt igenkänningsnivå för diagnos D i. I detta fall är sannolikheten för den närmast konkurrerande diagnosen inte högre än 1 - P i. Vanligtvis accepteras P i≥ 0,9. Givet att

P(D i /K *)

(5.24)

något beslut om diagnos fattas inte (vägran att erkänna) och ytterligare information krävs.

Beslutsprocessen i Bayes-metoden vid beräkning på dator sker ganska snabbt. Till exempel att göra en diagnos för 24 tillstånd med 80 flersiffriga tecken tar bara några minuter på en dator med en hastighet på 10 - 20 tusen operationer per sekund.

Som antytts har Bayes-metoden vissa nackdelar, till exempel fel i att känna igen sällsynta diagnoser. I praktiska beräkningar är det tillrådligt att utföra diagnostik för fallet med lika sannolika diagnoser, sätta

P(Di) = l/n (5.25)

Då kommer diagnosen att ha det största posteriora sannolikhetsvärdet D i, för vilka R (K* /D i) maximal:

K*D i,Om P( K*/D i) > P( K*/D j)(j = 1, 2,..., n; jag ≠ j). (5.26)

Med andra ord ställs en diagnos D i om denna uppsättning symtom är vanligare under diagnosen D iän med andra diagnoser. Denna beslutsregel motsvarar metoden för maximal sannolikhet. Av det föregående följer det den här metodenär ett specialfall av Bayes-metoden med lika stor sannolikhet för diagnoser. I maximum likelihood-metoden har "vanliga" och "sällsynta" diagnoser lika rättigheter.

Det är värt att säga att för igenkänningstillförlitlighet måste villkor (5.26) kompletteras med ett tröskelvärde

P(K */D i) ≥ Pi ,(5.27)

Var P i- förvald igenkänningsnivå för diagnos D i.

Bayes metod - koncept och typer. Klassificering och funktioner för kategorin "Bayes Method" 2017, 2018.

Denna formel gäller för det fall då undersökningen utförs enligt en uppsättning tecken TILL, inklusive skyltar k 1 ,k 2 , ..., k v . Var och en av tecknen k j Det har m j rankas ( k j jag, k j 2 , ..., k js, ...,). Som ett resultat av undersökningen blir implementeringen av egenskapen känd

k j * = k js (1.5.)

och hela komplexet av tecken K*. Indexet *, som tidigare, betyder det specifika värdet (förverkligandet) av attributet. Bayes formel för en uppsättning funktioner har formen

P(D i /TILL* )= P(D i)P(TILL */D i)/P(TILL* )(i = 1, 2, ..., n), (1.6.)

Var P (D i /TILL* ) --sannolikhet för diagnos D i efter att resultatet av undersökningen på en uppsättning tecken blev känt TILL, P (D i) --preliminär sannolikhet för diagnos D i(enligt tidigare statistik).

Formel (1.6.) gäller för alla n möjliga tillstånd (diagnoser) i systemet. Det antas att systemet endast är i ett av de angivna tillstånden och därför

I praktiska problem tillåts ofta möjligheten att det finns flera tillstånd A1, ....., Ar, och några av dem kan förekomma i kombination med varandra.

P(TILL*/ D i) = P(k 1 */D i)P (k 2 */k 1 *D i)...P (k v */k l *...k* v- 1 D i), (1.8.)

Var k j * =k js--kategori av egenskapen som avslöjas som ett resultat av undersökningen. För diagnostiskt oberoende tecken

P (TILL*/ D i) = P (k 1 */D i) P (k 2 */D i)... P (k v * / D i). (1.9.)

I de flesta praktiska problem, särskilt med ett stort antal funktioner, är det möjligt att acceptera villkoret av oberoende av funktioner även i närvaro av betydande korrelationer mellan dem.

Sannolikhet för uppkomsten av ett komplex av tecken K*

P(TILL *)= P(D s )P(TILL */D s ) .(1.10.)

Den generaliserade Bayes-formeln kan skrivas på följande sätt :

P(D i /K* ) (1.11.)

Var P (TILL*/ D i)bestäms av jämlikhet (1.8.) eller (1.9.). Av relation (1.11.) följer

P(D i /TILL *)=l, (1.12.)

vilket naturligtvis bör vara fallet, eftersom en av diagnoserna nödvändigtvis realiseras, och realiseringen av två diagnoser samtidigt är omöjlig. Vänligen notera att Bayes formelns nämnare är densamma för alla diagnoser. Detta låter dig först avgöra sannolikheter för samtidig förekomst i:e diagnosen och denna implementering av en uppsättning funktioner

P(D i TILL *) = P(D i)P(TILL */D i) (1.13.)

och då posterior sannolikhet för diagnos

P (D i /TILL *) = P(D i TILL *)/P(D s TILL *). (1.14.)

Observera att det ibland är tillrådligt att använda preliminär logaritm med formeln (1.11.), eftersom uttrycket (1.9.) innehåller produkter av små kvantiteter.

Om genomförandet av en viss uppsättning funktioner TILL * är bestämmande för diagnos D sid , då förekommer inte detta komplex i andra diagnoser:

Sedan, i kraft av jämlikhet (1.11.)

Den deterministiska diagnosens logik är således ett specialfall av probabilistisk logik. Bayes formel kan också användas i fallet när några av funktionerna har en diskret fördelning och den andra delen har en kontinuerlig fördelning. För kontinuerlig distribution används distributionstätheter. Men i beräkningsplanen är denna skillnad i egenskaper obetydlig om definitionen av en kontinuerlig kurva utförs med hjälp av en uppsättning diskreta värden.

Bayes-metoden är en av de enklaste och mest kraftfulla metoderna. Denna metod är baserad på att beräkna den villkorade sannolikheten för förekomsten av en sådan händelse som diagnos Di när en specifik implementering av ett komplex av funktioner K * visas.

Låt oss först överväga de viktigaste bestämmelserna i denna metod i det enklaste fallet, när det finns en diagnos Di och ett binärt tecken K j som uppstår när denna diagnos uppträder.

Låt oss definiera några begrepp:

1. P(D i) - a priori (pre-experimentell) sannolikhet för diagnos D i. Denna sannolikhet bestäms från statistiska data i det inledande skedet av tillämpningen av metoden baserat på följande överväganden. Om det under en undersökning av N diagnosobjekt fastställs att Ni av dem har diagnosen Di, så bestäms sannolikheten för att denna diagnos inträffar av förhållandet

2. P(K j / D i) - a priori villkorlig sannolikhet för utseendet av egenskapen K j i objekt med ett tekniskt tillstånd (diagnos) D i. Denna sannolikhet bestäms också i inledningsskedet med hjälp av tillgängliga statistiska data. Om av de N undersökta objekten Ni diagnostiserades med Di, och av dessa N ij objekt hade egenskapen K j, så beräknas den villkorade sannolikheten för utseendet av egenskapen K j i objekt med diagnosen Di enligt följande:
.

4. P(K j) - a priori sannolikhet för utseendet av särdraget K j i alla objekt, oavsett deras tillstånd. Det vill säga, om Nj av N objekt, oavsett deras tekniska tillstånd, visade sig ha ett tecken K j , så bestäms denna sannolikhet av följande förhållande:

.

Låt oss komma ihåg några bestämmelser i sannolikhetsteorin. Låt oss ha två händelser A och B. Sannolikheterna för att dessa händelser P(A) och P(B) ska inträffa är kända, liksom den villkorade sannolikheten för händelse A om händelse B redan har ägt rum P(A / B) och den villkorade sannolikheten att händelse B inträffar om händelse B redan har ägt rum händelse A P(B/A). Sedan bestäms sannolikheten för att händelserna A och B P(A,B) ska inträffa samtidigt av följande formel:

P(A,B) = P(A) P(B/A) = P(B) P(A/B).

Med hjälp av denna formel och begreppen ovan kan vi skriva ner sannolikheten för att diagnosen Di och symtom K j samtidigt inträffar enligt följande:

P(Di, Kj) = P(Di) P(Kj/Di) = P(Kj) P(Di/Kj).

I detta uttryck är värdet P(D i / K j) den villkorade sannolikheten för existensen av diagnosen Di när egenskapen Kj detekteras, det vill säga detta är det värde som eftersträvas i den probabilistiska metoden för att lösa problem med diagnosigenkänning. Efter lämpliga transformationer från det sista uttrycket får vi Bayes formel

P(Di/Kj) = P(Di) P(Kj/Di)/P(Kj). (4.1)

Formel (4.1) erhölls för det fall då ett enkelt tecken används för att ställa en diagnos.

För att fatta ett beslut om diagnos vid användning av en uppsättning (komplex) av tecken, används den generaliserad Bayes formel, vilket kan erhållas från följande överväganden. Om diagnosen utförs baserat på en uppsättning egenskaper, får vi som ett resultat av undersökningen en specifik implementering av varje j:te egenskap K * j och därför en specifik implementering av komplexet av egenskaper K * som en hela. I det här fallet kommer Bayes formel att visas i formuläret

(4.2)

där P(D i / K *) är den villkorade sannolikheten för att hitta ett diagnostiskt objekt i diagnosen Di, förutsatt att under undersökningen erhölls en realisering av K * av komplexet av tecken K; P(K *) - sannolikheten för uppkomsten av en specifik implementering K * av ett komplex av funktioner K i alla diagnostiserade objekt, oavsett deras tekniska tillstånd; P(K * /D i) - villkorad sannolikhet för uppkomsten av en specifik implementering K * av ett komplex av diagnostiska egenskaper K för objekt som diagnostiseras Di.

Låt oss omvandla det sista uttrycket med hänsyn till följande överväganden.

Låt oss då anta att systemet endast kan vara i ett av n tekniska tillstånd


.

Vi kommer att anta att de individuella diagnostiska tecknen som ingår i komplexet av tecken är oberoende. Detta antagande är ganska giltigt för verkliga förhållanden med ett stort antal påverkande faktorer. Då kan den villkorade sannolikheten P(K * / D i) i enlighet med de kända bestämmelserna i sannolikhetsteorin representeras som en produkt:

där P(K * j / D i) är den villkorade sannolikheten för uppkomsten av en specifik implementering av K * j j-te särdraget när det diagnostiska objektet hittas i diagnosen Di; j = 1...L.

Sannolikheten för uppkomsten av en specifik implementering av ett komplex av egenskaper när ett objekt hittas i alla diagnoser P(K *) kan representeras enligt följande:

Med hänsyn till de sista relationerna, skriver vi om ekvationen (4.2) i dess slutliga form:

. (4.3)

Den resulterande ekvationen kallas generaliserad Bayes formel.

Låt oss göra några kommentarer om de erhållna relationerna.

1. Eftersom objektet som kontrolleras nödvändigtvis kommer att finnas i en av diagnoserna Di, kan vi, med hänsyn till relation (4.3), skriva:

.

2. Om implementeringen av en viss uppsättning särdrag K* sker endast för en diagnos D S och inte inträffar för andra diagnoser, så kallas en sådan realisering av uppsättningen funktioner bestämning för diagnosen D S . För denna implementering av ett komplex av egenskaper är relationen giltig

Sedan följer det av den generaliserade Bayes-formeln

En analys av dessa kommentarer tyder på att det deterministiska tillvägagångssättet är ett speciellt fall av sannolikhet.

För den praktiska användningen av Bayes-metoden är det i det inledande skedet nödvändigt att beräkna a priori-sannolikheterna för uppkomsten av de i-te diagnoserna och de villkorliga a priori-sannolikheterna för uppkomsten av den m:te siffran i j- funktionen när det diagnostiska objektet hittas i den D i-te diagnosen. Beräkningen av dessa sannolikheter görs på basis av statistiskt material som erhållits från drift. Resultaten av dessa beräkningar och resultaten av de slutliga beräkningarna av sannolikheterna för uppkomsten av diagnoser för den resulterande uppsättningen egenskaper presenteras bekvämt i tabellform.

Låt oss överväga den diagnostiska proceduren med den Bayesianska metoden.

I det inledande skedet, baserat på det insamlade statistiska materialet, bestäms följande:

En uppsättning diagnoser Di som ska kännas igen;

De tidigare sannolikheterna för förekomst av dessa diagnoser är P(D i).

Priori-sannolikheter för utseendet av den m:te siffran i den j:te egenskapen K jm när objektet är i diagnosen Di, det vill säga P(K jm / D i) .

För att underlätta användningen presenteras dessa data i form av tabell 4.1, som kallas en diagnostisk matris i Bayes-metoden.

Tabell 4.1

Diagnostisk matris i Bayes-metoden

\ D i

Att sammanställa denna tabell är den viktigaste punkten vid diagnostisering med den Bayesianska metoden. Eftersom driften pågår uppdateras initialdata ständigt och elementen i den diagnostiska matrisen måste ständigt förfinas.

Med hjälp av data som presenteras i den diagnostiska matrisen, för var och en av diagnoserna Di med hjälp av den generaliserade Bayes-formeln (4.3), beräknas de postexperimentella (posteriora) sannolikheterna för uppkomsten av diagnosen Di, förutsatt att under mätningarna en specifik implementering av komplexet av egenskaper K * s erhålls, det vill säga P(Di/K * s). För att underlätta användningen anges beräkningsresultaten i tabellen. 4.2 i följande formulär:

Tabell 4.2

Di\P(D i / K * S)

Den avgörande regeln är valet av en diagnos som har den maximala beräknade sannolikheten för en given uppsättning egenskaper, det vill säga, när man använder Bayes-metoden, hör ett objekt med en uppsättning egenskaper K * s till diagnosen med den högsta beräknade ( posterior) sannolikhet P(D i / K * s).

Det bör noteras att Bayes-metoden har ett antal nackdelar:

1. För att implementera denna metod krävs en stor mängd experimentella initiala data, som endast kan erhållas från drift.

2. Metoden kännetecknas av stora fel i identifieringen av sällsynta diagnoser på grund av grova uppskattningar av sannolikheten för att dessa diagnoser ska inträffa.

3. Det finns inget entydigt kriterium för att välja det tröskelvärde för sannolikhet P(D i /K * s), som används för att fatta beslut om diagnosen.

Trots sina brister är Bayes-metoden ganska effektiv och lätt att implementera, även när man använder datorteknik.

Låt oss förklara Bayes-metoden med ett exempel. Låt oss anta att under drift av en flyggasturbinmotor övervakas rotorns utloppstid vid stopp t och vibrationen i motorkroppen V. Följande accepteras som diagnostiska tecken: K 1 - rotorns utlopp tiden är kortare än vad som krävs tekniska specifikationer; K 2 - ökad vibration. För denna typ av gasturbinmotor är utseendet på dessa tecken associerat med följande diagnoser: D 1 - ökat gap längs höljesflänsarna på turbinrotorbladen; D 2 - slitage på rotorns lagerbanor. Vi kommer att beteckna det funktionsbara tillståndet som D 3 .

Under drift fann man att för motorer i gott skick uppträder inte symptom K 1 och symptom K 2 förekommer i 10 % av motorerna. Det vill säga P(K1/D3) = 0 och P(K2/D3) = 0,1.

Det är känt att 85 % av motorerna klarar sin livslängd utan defekter för 10 % av motorerna, diagnos D 1 observeras, och för 5 % observeras diagnos D 2. Därför accepterar vi P(D 1) = 0,1; P(D2) = 0,05; P(D3) = 0,85.

Vidare, under insamlingen av statistik, fastställdes det att K 1-tecknet förekommer i 15 % av motorerna som diagnostiserats med D 1 och i 55 % av motorerna som diagnostiserats med D 2. Därför P(K 1 / D 1) = 0,15 och P(K 1 / D 2) = 0,55. Tecken K 2 förekommer i 10 % av motorerna diagnostiserade med D 1 och i 50 % av motorerna diagnostiserade med D 2, det vill säga P(K 2 / D 1) = 0,1 och P(K 2 / D 2) = 0,50.

Låt oss skapa en diagnostisk matris. I det här fallet kommer vi att anta att tecknen K 1 och K 2 är binära och betecknar: K 1 - frånvaro av det första tecknet och K 2 - frånvaro av det andra tecknet. Sedan bestäms sannolikheterna för att det första och det andra tecknet inte uppträder av relationerna

P( K 1 / D i) = 1 - P(K 1 / D i) och P( K 2/Di) = 1 - P(K2/Di).

Tabell 4.3

Diagnostisk matris

P(K j / D i)\ D i

P( K 1/D i)

P( K 2/D i)

Med hjälp av Bayes formel bestämmer vi sannolikheten för att varje diagnos ska inträffa för olika kombinationer av egenskaper. Till exempel, i enlighet med formel (4.3), kommer sannolikheten för att en motor ska diagnostiseras D 1 när båda tecknen observeras att bestämmas från sambandet

Vi sammanfattar beräkningsresultaten i tabell. 4.4, liknande tabellen. 4.2

Tabell 4.4

P(D i / K 1 , K 2)

P(D i / K 1 , K 2)

P(D i/K1, K 2)

P(D i / K 1 , K 2 )

I enlighet med de erhållna resultaten kan följande slutsats dras:

1. Om båda tecknen upptäcktes under diagnosen (ökad vibration och kort rotorns utloppstid), kan vi med säkerhet anta att rotorlagret har slitit ut löpbanden.

2. Om båda tecknen saknas under diagnosen är motorn troligen i gott skick.

3. Om endast det första tecknet upptäcks under diagnosen (förlängd drifttid), kan vi med säkerhet säga att motorn är felaktig, men ytterligare forskning är nödvändig för att separera felaktiga tillstånd.

4. Om under diagnos endast det andra tecknet (ökad vibration) upptäcks, kan det med stor sannolikhet antas att motorn är i gott skick.