Utilizarea clasificarii si regresiei bazate pe padure pentru a modela si estima valorile casei

Versiunea ArcGIS Pro 2.2 are un nou instrument interesant de invatare automata care poate ajuta la realizarea predictiilor. porno chic Se numeste Clasificare si regresie bazata pe padure si permite analistilor sa proiecteze, sa testeze si sa implementeze modele predictive in mod eficient.

Clasificarea si regresia bazate pe padure aplica algoritmul forestier aleatoriu al lui Leo Breiman, o metoda populara de invatare automata supravegheata utilizata in clasificare si predictie. porno coq Instrumentul permite analistilor sa incorporeze cu usurinta atribute tabulare, caracteristici bazate pe distanta si rasteri explicative pentru a construi modele predictive si extinde modelarea predictiva pentru a deveni accesibila si posibila pentru toti utilizatorii GIS.

Pentru a arata ce este posibil cu Clasificarea si regresia bazate pe padure, am abordat o problema populara in comunitatea stiintei datelor: prezicerea valorilor vanzarilor de case. porno gay hard Sa aruncam o privire la un exercitiu de baza pentru a construi un model care sa incorporeze factori spatiali pentru a ajuta la imbunatatirea predictiei preturilor de vanzare a locuintelor din California.

Prezicerea preturilor locuintelor in California

Vom incepe prin a folosi popularul California Housing Dataset de la Kaggle, care contine tracturi din California cu o serie de atribute agregate pentru casele din fiecare tract. porno anal arabe

Este greu sa faci ceva semnificativ doar uitandu-te la tabelul de mai sus, asa ca haideti sa facem o harta a fiecarui traseu, simbolizata prin valoarea medie de vanzare a locuintelor la fiecare locatie:

Valori de vanzare la domiciliu de Tracts in California

In aceasta harta, fiecare punct semnifica centroidul unui tract din California. Gama de culori reprezinta valoarea medie de vanzare a locuintelor pentru toate locuintele din tract. fornite porno Albastrul reprezinta valori scazute ale vanzarilor, galbenul reprezinta valoarea medie a vanzarilor, iar rosul reprezinta cele mai mari valori.

Doar din vizualizarea acestei harti, observati vreun tipar general?

Este posibil sa observati ca locuintele la preturi mai ridicate sunt situate in apropierea celor mai mari zone metropolitane. moteur de recherche porno S-ar putea sa observati, de asemenea, ca locuintele la preturi mai ridicate sunt situate langa coasta de coasta. O diagrama exploratorie rapida in ArcGIS Pro ne ajuta sa exploram aceste tipare:

Distributia valorii medii a casei in functie de proximitatea oceanului

Sa vedem restul datelor din tabelul furnizat. humour porno Fiecare inregistrare contine cateva date de baza pentru toate locuintele din tract:

Valoarea mediana a casei pentru fiecare tract este variabila noastra de prezis, iar aceste atribute sunt probabil importante pentru a ajuta la estimarea fiecarei valori.

Vom incepe urmand exemplul oferit de Aurelien Geron in cartea sa Hands-On Machine Learning cu Scikit-Learn si TensorFlow , unde a fost construit un model de padure aleatoriu folosind in principal factori non-spatiali (adica atributele din tabelul de mai sus) . porno boruto Vom compara acest model cu un al doilea model in care vom incepe sa aducem alte straturi GIS pentru a evalua modul in care apropierea fiecarui traseu de locatiile de interes poate ajuta modelul sa se imbunatateasca atunci cand estimam valorile medii ale casei.

Model non-spatial

Primul nostru model va urma exemplul de invatare automata hands-on cu Scikit-Learn si TensorFlow, folosind urmatoarele caracteristici pentru fiecare inregistrare a tractului:

  • Venitul mediu
  • Varsta medie a locuintelor
  • Total camere
  • Total dormitoare
  • Populatia
  • Gospodariile casnice
  • Apropierea Oceanului

Sa deschidem instrumentul de clasificare si regresie bazat pe padure si sa incepem:

Primul parametru desemneaza tipul de rulare pe care doriti sa il executati. film porno 18 ans Pentru aceasta explorare de baza, dorim sa evaluam diagnosticul modelului (adica performanta predictiva) si sa monitorizam schimbarile pe masura ce introducem si testam combinatii de factori. Din acest motiv, sa lasam acest parametru la „Numai tren”. porno shemale

Vom specifica caracteristicile de antrenament de intrare, trecand stratul GIS de tracturi din California, variabila noastra de prezis, utilizand atributul „median_house_value”, apoi vom specifica ce atribute vor fi utilizate pentru model in sectiunea parametrului „Variabile de instruire explicative” de catre selectand fiecare coloana corespunzatoare din datele de intrare. Dupa finalizare, intrarile instrumentului dvs. porno brasil de geoprocesare ar trebui sa arate astfel:

Odata ce ati executat modelul, instrumentul construieste o padure care stabileste o relatie intre variabilele explicative si variabila desemnata pentru a prezice. Pentru mai multe informatii despre cum functioneaza acest instrument, va rugam sa cititi acest lucru. video porno coq nu

Odata ce instrumentul isi termina rularea, ar trebui sa primiti un diagnostic detaliat al performantei modelului dvs.



  • porno ado black
  • webchoc porno
  • porno soumission
  • film porno xxl
  • porno camerounaise
  • film porno soft
  • movie porno
  • porno xxxxx
  • penis porno
  • lesbian porno
  • porno aloha
  • karine le marchand porno
  • vidéo porno viol
  • laetitia lacourt porno
  • homme porno
  • femme de menage porno
  • afida turner porno
  • yoga porno
  • porno francais hard
  • mia kalifa porno





:

Evaluarea importantei variabilei de varf ofera un sentiment general al factorilor care au ajutat modelul (venitul mediu si proximitatea oceanului au contat foarte mult). bon porno Deocamdata, sa notam valoarea noastra R-Squared: 0,706 (aceasta poate diferi usor cand executati).

Va rugam sa retineti: Pentru a crea un model care nu se schimba in fiecare runda, o setare poate fi setata in setarea mediului Generator aleator de numere. porno perfectgirl Va exista in continuare aleatorie in model, dar aceasta aleatorie va fi consecventa intre runde.

Model spatial

Acum ca am incercat abordarea initiala a estimarii valorilor vanzarilor de case care utilizeaza in primul rand factori non-spatiali, sa exploram modul in care modelul se schimba pe masura ce introducem caracteristici de formare bazate pe distanta. rocco siffredi porno Scopul este de a calcula distantele dintre fiecare tract si o serie de caracteristici potential importante care se refera la preturile locuintelor. Pentru exercitiul nostru exploratoriu simplu, am adus clase de caracteristici punctuale de terenuri de golf, scoli, spitale, zone de agrement si cimitire. porno beeg Vom aduce, de asemenea, o clasa de caracteristici polilinice a litoralului californian.

Pentru a calcula toate acele distante, puteti concepe un script care sa itereze pe fiecare inregistrare si sa rulati cateva functii de proximitate pentru a determina distantele dintre fiecare inregistrare de geometrie . actrice porno rousse .. porno mario sau puteti pur si simplu deschide instrumentul de clasificare si regresie bazat pe padure si trageti si fixati fiecare caracteristica claseaza in parametrul Caracteristici explicative ale distantei de formare :

Dupa ce ati incarcat fiecare caracteristica de distanta, putem rula instrumentul. Parametrii nostri in acest moment aratau astfel:

Simtiti-va liber sa experimentati cu proprii factori potentiali de formare explicativa! Un scurt exemplu: Puteti gasi un set de date cu locatii ale statiilor de transport public, sa il aduceti in Proiectul ArcGIS Pro si sa incarcati locatiile in parametrul Explanatory Training Distance Features? Cum va schimba acest factor modelul?

Odata ce instrumentul ruleaza, ne putem evalua diagnosticul si il putem compara cu modelul original:

Noile diagnostice de regresie aterizeaza la un R-Squared de 0,763. branlette porno Interesant este faptul ca un model de baza cu preponderent factori bazati pe distanta a functionat putin mai bine decat modelul original, care a luat in considerare in principal caracteristicile non-spatiale ale locuintelor (numarul bailor etc.). porno vor Daca este ceva – aceasta este dovada bazata pe date a locatiei, locatiei, adagiului de locatie!

Rularea instrumentului va oferi, de asemenea, rezultatele modelului in datele de intrare:

Acest lucru nu este inerent util de la sine, deoarece practic predicem inregistrari cu valori cunoscute, dar este util sa vedem cum functiile bazate pe distanta modifica performanta modelului. Mai bine, este extrem de util pentru a putea incorpora date GIS suplimentare existente in consideratiile modelului de proximitate intr-un mod atat de rapid si intuitiv.

Nota: Un aspect important suplimentar al clasificarii si regresiei bazate pe padure este modul in care efectele multicoliniaritatii in factorii explicativi candidati nu va impiedica sa creati modele eficiente. Pentru a intelege modul in care padurile aleatorii se atenueaza pentru problemele cu multicoliniaritate, va incurajez sa explorati mai departe in documentatia instrumentului si in documentatia suplimentara a padurilor aleatorii.

Concluzie si resurse

Efectuarea de analize pentru a prezice orice eveniment sau valoare este cu siguranta un exercitiu explorator, iterativ, dezordonat si care consuma mult timp. Pentru a sprijini aceste fluxuri de lucru, avem nevoie de instrumente care sa ne ajute sa incorporam rapid date spatiale, sa sustinem testarea, sa ne evalueze rapid rezultatele si sa ne permita repetarea pana cand ajungem la un rezultat satisfacator.

Clasificarea si regresia bazate pe paduri extinde utilitatea puternicului algoritm de invatare automata a padurilor aleatorii prin incorporarea abilitatii de a lua in considerare nu numai atribuirea de date in modelele dvs., ci si caracteristici de instruire bazate pe distanta si rasterele explicative pentru a beneficia de locatie in analiza dvs.

Resurse

Documentarea instrumentului de clasificare si regresie bazata pe padure

Cum functioneaza clasificarea si regresia bazate pe padure

Resurse statistice spatiale

Utilizarea clasificarii si regresiei bazate pe padure in predictia cazului de spitalizare a astmului