Modele la pariuri

Larry

Membru bine-cunoscute
1 Apr 2010
1,490
1,012
113
Continuăm discuția despre modelele de aici, care a fost pe tema curselor de cai.

Așa cum am spus @cosmicsports , există multe tipuri de moduri de a adăuga modele. Voi lua votul simplu, cu majoritate. Polifonia câștigă.
Să presupunem că primim 3 modele fiecare cu o rată de succes de 70%. Dacă le adăugăm pe toate împreună și în fiecare selecție obținem majoritatea, atunci modelul crește rata de succes.
Să presupunem că dorim în 10 meciuri care este rezultatul corect 1. Deci în 10 meciuri, fiecare model primește 7 ași și 3 zerouri ca un eșec.

vote.jpg


A, b, c, sunt modelele, iar votul este previziunea generală care iese din majoritate. Acolo obținem 8 din 10, adăugând doar opiniile modelelor. Este matematică, nu are nicio legătură cu altceva. Singurul lucru pe care trebuie să-l verificați este dacă primiți cu adevărat 7 din 10 pe toate modelele.
Căutați ansamblu de bagaje, sporire, amplificare.
 
  • Aprecieri
reacţii: betover
Continuăm discuția despre modelele de aici, care a fost pe tema curselor de cai.

Așa cum am spus @cosmicsports , există multe tipuri de moduri de a adăuga modele. Voi lua votul simplu, cu majoritate. Polifonia câștigă.
Să presupunem că primim 3 modele fiecare cu o rată de succes de 70%. Dacă le adăugăm pe toate împreună și în fiecare selecție obținem majoritatea, atunci modelul crește rata de succes.
Să presupunem că dorim în 10 meciuri care este rezultatul corect 1. Deci în 10 meciuri, fiecare model primește 7 ași și 3 zerouri ca un eșec.

Vedeți atașamentul 29060

A, b, c, sunt modelele, iar votul este previziunea generală care iese din majoritate. Acolo obținem 8 din 10, adăugând doar opiniile modelelor. Este matematică, nu are nicio legătură cu altceva. Singurul lucru pe care trebuie să-l verificați este dacă primiți cu adevărat 7 din 10 pe toate modelele.
Căutați ansamblu de bagaje, sporire, amplificare.

Nu, în finală, norocul decide.
În finală și Olympiacos - Kastoria, norocul decide.
Dar adăugând modele, faceți puțin progres la fiecare pas.
Ai ajuns undeva, care este capabil să câștige piața sau nu.
 
  • Aprecieri
reacţii: betover
Nu, în finală, norocul decide.

Nu, norocul nu decide. Când spui 70%, este 70%. De aceea am subliniat că trebuie să vă asigurați de eficiența modelelor dvs. Astăzi va fi 68%, mâine 72%.
În ceea ce privește exemplul de mai sus, permiteți-mi să adaug că există și posibilitatea ca compoziția modelelor să nu fie mai bună, în cazul în care toate cele 3 modele oferă același lucru.
Adică în aceleași poziții există zerouri în 3. Și probabilitatea este (0,30 ^ 3) * 3 = 8,1%, dacă nu mă înșel.
 
Nu, norocul nu decide. Când spui 70%, este 70%. De aceea am subliniat că trebuie să vă asigurați de eficiența modelelor dvs. Astăzi va fi 68%, mâine 72%.
În ceea ce privește exemplul de mai sus, permiteți-mi să adaug că există și posibilitatea ca compoziția modelelor să nu fie mai bună, în cazul în care toate cele 3 modele oferă același lucru.
Adică în aceleași poziții există zerouri în 3. Și probabilitatea este (0,30 ^ 3) * 3 = 8,1%, dacă nu mă înșel.

Acordurile contează și în conflict.
Problema este statistică.
 
Când dorim să definim sau să examinăm un Model (cu unele completări, corecțiile poate în curs) trebuie să stabilim sau să definim ce termeni și elemente va avea Modelul, deci, la nesfârșit, nu se întâmplă nimic.
De exemplu, puteți vota cu 5-10-20, date și puteți alege unele dintre ele sau cele care vor fi preferate, de exemplu, de la 70% și mai sus;
 
Când dorim să definim sau să examinăm un Model (cu unele completări, corecțiile poate în curs) trebuie să stabilim sau să definim ce termeni și elemente va avea Modelul, deci, la nesfârșit, nu se întâmplă nimic.
De exemplu, puteți vota cu 5-10-20, date și puteți alege unele dintre ele sau cele care vor fi preferate, de exemplu, de la 70% și mai sus;

Desigur, vei alege cele mai bune modele X care se joacă de la un anumit procent și mai mare.
Dacă am un model cu 90%, îl voi amesteca cu alte 2 modele care dau 50%? . Bineînțeles că nu, pentru că, la vot, vor bate modelul bun în unele cazuri, ceea ce duce la o performanță mai slabă. Se dovedește atât din punct de vedere matematic, cât și intuitiv, este de înțeles.
Dar când vorbim de modele care au mai mult sau mai puțin la fel, atunci da, cu atât mai mult, cu atât mai bine.
 
Desigur, vei alege cele mai bune modele X care se joacă de la un anumit procent și mai mare.
Dacă am un model cu 90%, îl voi amesteca cu alte 2 modele care dau 50%? . Bineînțeles că nu, pentru că, la vot, vor bate modelul bun în unele cazuri, ceea ce duce la o performanță mai slabă. Se dovedește atât din punct de vedere matematic, cât și intuitiv, este de înțeles.
Dar când vorbim de modele care au mai mult sau mai puțin la fel, atunci da, cu atât mai mult, cu atât mai bine.

Dar le confundați?
Este diferit atunci când încercăm să investigăm o situație care nu depinde mult de evenimentele aleatorii.
De exemplu. care va fi următorul președinte al Statelor Unite, în stilul fundației și imperiului Asimov.
Dar în sport există întotdeauna un experiment de noroc și încercăm să aflăm ce este un experiment de noroc. Odată ce l-am găsit, atunci este un zid - nu mergem mai departe. De asemenea, din moment ce știam cu toții exact ce este experimentul norocului, al cărții și al oamenilor, pariurile nu ar avea sens. Ar fi loto.
 
Dar le confundați?
Este diferit atunci când încercăm să investigăm o situație care nu depinde mult de evenimentele aleatorii.
De exemplu. care va fi următorul președinte al Statelor Unite, în stilul fundației și imperiului Asimov.
Dar în sport există întotdeauna un experiment de noroc și încercăm să aflăm ce este un experiment de noroc. Odată ce l-am găsit, atunci este un zid - nu mergem mai departe. De asemenea, din moment ce știam cu toții exact ce este experimentul norocului, al cărții și al oamenilor, pariurile nu ar avea sens. Ar fi loto.

Nu pot înțelege ce vrei să spui.
Vorbesc despre modele. Mașini care pot prezice. Nu-mi pasă dacă experimentul este norocos sau nu, am pus variabile care îmi oferă multe informații, care pot ajuta la predicție. Chiar și rotirea monedelor poate conține variabile precum viteza de avans, viteza vântului, greutatea monedei, temperatura camerei etc.
În ochii tăi (nu vorbesc personal) arată 50-50. Cel care analizează, încearcă să găsească ce variabilă îi va da dreptul să prezică peste 50%.
Deci, facem 3 mașini, fiecare dintre acestea asigurând exact 90%. La 10 ture, fiecare dintre voi va găsi 9 din ture corecte. Deci cineva spune: „Dacă combinăm predicțiile, este mai bine?”.
Ei bine, da, este mai bun și demonstrează matematic cât de bine este și de câte ori pot să mă aștept la predicții mai bune.
Analizez asta pentru 2-3 postări. Nu spun altceva și nu cred că este absurd.

De asemenea, puteți vedea aici disertația care spune clar despre luarea deciziilor. Pe pagina 81 este, dacă doriți să o vedeți. Desigur, el îl analizează și mai mult, spunând că este bine ca modelele să aibă mai multe diferențe între ele în ceea ce privește predicția, adică să nu prezică exact aceleași răsuciri.

 
Lucrarea pe care ați legat-o este gunoi în ceea ce privește rezultatele pe care le-a prezentat și vă explic. Pentru început, au luat o problemă de clasificare cu 1-X-2 și au transformat-o într-o regresie de la 0 la 1. Acest lucru în sine nu este potrivit ca tehnică, dar ok, să trecem mai jos. Marea problemă este unde are loc căutarea în grilă pentru x1, x2. Au făcut o căutare în grilă și au ales perechea x1, x2 care oferă cele mai bune rezultate și iată problema pentru că acum modelele lor au overfit. Pentru fiecare 0 <= x1 <= 1 și 0 <= x2 <= 1 va exista un interval de x1 și x2 care va da rezultate pozitive. De exemplu, pentru χ1 = 0.1 și χ2 = 0.46 puteți obține un profit de 5%, iar pentru χ1 = 0.23 și χ2 = 0.67 puteți obține un profit de 6,5%. Alegerea celei de-a doua perechi nu înseamnă că este cea potrivită. Același lucru se aplică dacă în loc de profit, setați rata de accesare ca parametru de evaluare.

De asemenea, eșantionul lor este prea mic pentru orice concluzii. Am încercat această abordare cu numere aleatorii într-un eșantion de peste 1500 de jocuri. Adică, în loc să ies dintr-un model, numărul meu a fost doar un număr aleatoriu între 0 și 1. Rezultatul după căutarea în grilă a fost spectaculos, deoarece din nou au existat perechi x1, x2 care au dat profit. Acest lucru arată în sine cât de problematică este această abordare.

Dincolo de asta, în general nu puteți avea 3 modele instruite în același set de date pentru aceeași problemă și 1 pentru a da 90%, iar celelalte 2 cu 50%. De obicei, performanța este clar definită de datele pe care le aveți, astfel încât să vă așteptați în mod rezonabil dacă unul are 90%, celelalte 2 să fie undeva în apropiere. Nu va fi 90, va fi 75% sau 80%. Dacă există diferențe mari, atunci ceva a greșit probabil și trebuie să o cauți pentru a afla de ce se întâmplă acest lucru. Primul model poate avea îmbrăcăminte. De asemenea, ar fi bine ca fiecare model să folosească funcții pe care ceilalți nu le au. De exemplu, dacă aveți 40 de caracteristici în setul de date, încercați un model cu primele 20 și restul 2 cu 10 sau ceva. Nu că este greșit să pui aceleași caracteristici în toate modelele, dar prin ruperea lor, ajută la independența dintre ele și vei reduce eroarea de sistem.

Este ca și cum ai avea 3 persoane, prima bazată pe uniforme, a doua bazată pe preistorie și a treia pe baza istoriei performanței. Când le combin, mă aștept să aibă o performanță mai bună, deoarece aceste 3 funcționează independent unele de altele, astfel încât nu există nicio eroare sistemică și aceasta este o condiție de bază a înțelepciunii mulțimii. Acum, cum le combinați este și o problemă. Votarea va acorda aceeași pondere tuturor celor 3 vizualizări. Aș încerca să stivuesc cu clasificatorul final xgboost poate că ar avea rezultate mai bune.

De asemenea, este bine să nu te uiți la rata de succes a modelelor, deoarece este înșelător. Ideea este să nu spunem că acest joc este un as, ci că este un as cu 65%. Și acest 65% ar trebui să fie cât mai aproape de realitate. Dacă puneți un model care să prezică dacă o penalizare va fi un obiectiv sau nu, atunci toate modelele vor avea un succes de aproximativ 75%, deoarece în fiecare penalizare vor prezice un gol. Cu alte cuvinte, vei ajunge la un model inutil care, deși are un succes de 75%, dar dă obiective în toate predicțiile. Și cum rezolvați această problemă? Modificarea pragului implicit de la 0.5 la 0.75? Și de ce la 0.75 și nu 0.76? Poate ar fi mai bine să rupi șansele între paranteze, de exemplu 10% și să îți faci propria metrică pe baza căreia modelul va fi optimizat și evaluat. Adică, între paranteză 50% -60%, dacă meciurile din rezultat sunt verificate la 55%, atunci modelul dvs. ar trebui să fie aproape de 55% în șansele pe care le va oferi. Pentru că numai atunci vei putea găsi valoare. Într-un as pe care modelul îmi oferă 55% și am o șansă de 1.8 nu aș juca. Dar dacă pentru 55% am o probă de 1.9 atunci lucrurile se schimbă.

În general nu există o orientare. Văzând și fă te duci. Are nevoie de multe testări și, în special, de un set de date bun atât în ​​ceea ce privește eșantioanele, cât și caracteristicile. 500 și 1000 de jocuri cu caracteristici precum uniformele și scorurile echipei nu fac nimic.
 
Am 3 persoane, prima joacă pe baza uniformelor, a doua bazată pe preistorie și a treia bazată pe istoria cotei.

Unele probabilități complexe ale formei p1 ^ Q1 x p2 ^ Q2 x p3 ^ Q3 sunt valabile, normalizate la unitatea desigur.
Din eșantionul pe care l-ați format trebuie să calculați p1, p2, p3, dar și Q1, Q2, Q3 pentru a avea prinderea maximă. Poate ieși Q1 = 1, Q2 = 0.4, Q3 = 0 - adică preistoria cotei nu contează.
Cu toate acestea, veți obține ceva mai mult decât p1 pur, p2 pur sau p3 pur.
Același lucru se aplică „grupurilor de experți”.
Poate fi 100% adevărat, dar 100% ce?
100% din abordarea experimentului cu noroc real, echivalent cu lupta aș spune.
Chiar dacă proverbialul Olympiacos - Kastoria este meciul, este un experiment cu șansă
95% în favoarea Olympiacos. 5% au aparținut lui Sarganis!
 
Munca pe care ați legat-o este gunoi în ceea ce privește rezultatele

i. Lucrarea a fost prezentată pentru a demonstra compoziția clasificatorilor, pentru nimic mai mult.

ii.Da, sunt de acord cu dvs. cu privire la căutarea grilă menționată. O văzusem și eu când a ieșit gradul și am fost uimit.

iii. Exemplul cu compoziția 90-50-50 a fost extrem, pentru a arăta diferența și rezultatul dacă confundați astfel de modele între ele.

iv. Da la metrica pe care o menționați, care vă va oferi rezultate mai bune. Dar încă o căutăm!
 
Dacă puneți un model pentru a prezice dacă o penalizare va fi un obiectiv sau nu, atunci toate modelele vor avea aproximativ 75% succes, deoarece în fiecare penalizare vor prezice un gol. Cu alte cuvinte, veți ajunge la un model inutil care, deși are 75% succes, dar în toate predicțiile înscrie goluri. Și cum remediați această problemă?

Și pentru a reveni la același subiect, deoarece am uitat și asta:

Când aveți date care fac algoritmul să funcționeze în acest fel, atunci o tehnică este de a crea date artificiale pentru a crește numărul celor care sunt minoritare, ca în exemplul pe care îl dați.


Datele artificiale sunt create de un alt algoritm, care ia datele reale ale minorității și creează altele, care sunt relativ apropiate de valori.
În cele din urmă ajungeți să nu aveți o minoritate și puteți rula algoritmul.
Îmi amintesc un moment în care am analizat rezultatele într-un total de peste 7 goluri. Ceea ce spui tu a apărut, că totul a prezis Under 7,5 și a avut 96-97% succes (nu au putut prezice 3-4 meciuri care au venit Over 7,5).
Crearea artificială a datelor, algoritmul a reușit să aibă o predicție de 10% în meciurile cu peste 7,5. Că, dacă îl traduceți în cote, în 10 încercări, ați prins 1 meci cu cote de aproximativ 25.
Desigur, nu înseamnă că ați găsi o soluție la toate problemele ... A funcționat doar în aceasta.
 

Predictii

    • Nu există emisiuni de fotbal astăzi
  • 20:00
    Start Novasports
    • Zalgiris Kaunas - Armani Milano
  • 21:30
    Novasports 4HD
    • Bayern Munchen - Barcelona
  • 21:30
    Novasports 5HD
    • Baskonia - Anatolou Efes
  • 21:30
    Novasports Prime
    • Partizan - Olympiacos
  • 22:00
    Novasports 2HD
    • Villeurbanne - Monaco
  • Mâine 29-03-2024
  • 01:00
    COSMOTE SPORT 7 HD
    • NBA TV 2023-24
  • 01:05
    Novasports 4HD
    • Arizona - Clemson
  • 01:30
    COSMOTE SPORT 7 HD
    • Atlanta Hawks - Boston Celtics
  • 01:35
    Novasports 5HD
    • San Diego St. - UCONN
  • 02:00
    COSMOTE SPORT 4 HD
    • New Orleans Pelicans - Milwaukee Bucks
  • 04:00
    COSMOTE SPORT 7 HD
    • NBA TV 2023-24
  • 19:00
    COSMOTE SPORT 6 HD
    • ATP Masters 1000 2024
  • Mâine 29-03-2024
  • 01:00
    COSMOTE SPORT 6 HD
    • ATP Masters 1000 2024
Chat general
Ajutor utilizatori
  • Nimeni nu vorbește chiar acum.
  • PANATHA PANATHA:
    Ai văzut reluare?
  • Ertzan Ertzan:
    da
  • PANATHA PANATHA:
    Fenerbahce a vrut să amâne derby-ul din 7 aprilie cu Galatasaray pentru Supercupa Turciei din mila lui...Olympiakos, însă cererea sa concretă nu a fost acceptată de federația de fotbal a țării.
  • PANATHA PANATHA:
    Federația Turcă de Fotbal (TFF) a informat ambele cluburi că
    acest lucru are de-a face cu faptul că nu există o dată alternativă din cauza programului încărcat al echipelor.
  • Ertzan Ertzan:
    Urma sa o scriu dimineata dar nu a venit de pe telefonul mobil. Nereligioșii, așa cum era normal, au spus că nu vor accepta amânarea meciului. Echipa noastră a aplicat pentru amânare și din câte am citit au spus că meciul ar trebui să se țină la finalul campionatului, dar Federația, care s-a turnat pe ea și mai are de luat decizia pe „penalty-uri”, nu a acceptat-o.
  • Ertzan Ertzan:
    Fenerbahce este echipa care a strâns cele mai multe puncte din Europa, dar ei nu o văd așa, e în regulă, dar Dumnezeu este grozav
  • PANATHA PANATHA:
    ANT1 arata F1 duminica dimineata??
  • Ertzan Ertzan:
    Cred că doar plusul îl va avea
  • PANATHA PANATHA:
    Oh, la naiba...
  • Ertzan Ertzan:
    a avut o ofertă prin PPC pentru 9 luni gratuit acum 1 lună
  • PANATHA PANATHA:
    Da, știu....
  • PANATHA PANATHA:
    iar filmările sunt prezentate de Ant1, canalul gratuit la ora 17:00
  • PANATHA PANATHA:
    Anglia - Brazilia 0-0 la 36......Peste 0,5 in prima repriza
  • PANATHA PANATHA:
    Performanţă
    @31.0
  • M Forum Bot:
    Utilizatorul MrChow a început un nou subiect numit „Sfaturi pentru Maurice Moss" în Fotbal Predictii.
  • Ertzan Ertzan:
    Oferta PPC pentru Antenna plus continuă, cred, până pe 14 aprilie
  • Ertzan Ertzan:
    Cu câteva zile înainte de întâlnirea de la Fenerbahce, a ieșit la iveală întâlnirea pe care Hugh Dallas a avut-o cu arbitrii și discuțiile despre meciul Galatasara-Antalyaspor, unde arbitrul VAR recunoaște că a greșit în penalty-ul executat de jucătorul gălățeanului, unde de fapt a spus că jucătorul „se scufundă” în contactul mic pe care l-a avut care nu a fost pentru un penalty. Președintele nostru a vorbit și despre această fază în care a spus ce se întâmplă și Federația l-a găsit mincinos, lucruri drăguțe
  • S Forum Bot:
    Utilizatorul std157489 a început un nou subiect numit „Cercetarea studenților în comerțul cu amănuntul" în Cafenea.
  • PANATHA PANATHA:
    Doar Javelas ar putea primi un cartonaș roșu fără să joace... copilul este cu adevărat prost...
  • Ertzan Ertzan:
    pariase pe el :p
  • PANATHA PANATHA:
    Chiar ma intreb... pentru ca la fiecare meci e nervos pentru ca nu taie firul si se apuca de pescuit....
  • PANATHA PANATHA:
    Fotis o va reuși în puțin timp...
  • PANATHA PANATHA:
    Lucrurile astea nu se intampla...
  • Ertzan Forum Bot:
    Utilizatorul Ertzan a început un nou subiect numit „Cupa IFC#15 Semifinală (30-31/3/2024)" în Concursul IFC.
    Ertzan Forum Bot: Utilizatorul Ertzan a început un nou subiect numit „Semifinala Cupei IFC#15 (30-31/3)”...