Redukce atributů v datových sadách před tréninkem modelů ve scikit-learn

Často se setkáme s datovými sadami, které obsahují velké množství atributů. Většinou ovšem dopředu nevíme, které z nich má smysl použít pro trénink modelu a které atributy jsou naopak zbytečné či dokonce nevhodné. https://www.root.cz/clanky/redukce-atributu-v-datovych-sadach-pred-treninkem-modelu-ve-scikit-learn/?utm_source=rss&utm_medium=text&utm_campaign=rss

Creată 2mo | 18 sept. 2024, 23:50:09


Autentifică-te pentru a adăuga comentarii

Alte posturi din acest grup

Detectron2 – hra na špióny

V předchozích dvou článcích jsem z knihovny Detectron2 využíval modely trénované na konkrétní datové sadě, což byla v mém případě Common Objects in Context. Co když ale chci hledat něco, co v té datov

15 nov. 2024, 08:30:04 | root.cz
Trinity Desktop Environment (TDE) R14.1.13: závan starých časů o 4 roky později

V éře GNOME 47 a KDE Plasmy 6.2, obou běžících na Waylandu, v éře HDR, HiDPI i neceločíselného škálování může působit desktop stavějící na 23 lete starých dogmatech archaicky. Přesto má ale desktop Tr

14 nov. 2024, 23:20:04 | root.cz
Využití knihovny scikit-learn pro zpracování a analýzu přirozeného jazyka (NLP)

V článcích o scikit-learn jsme se zabývali zpracováním a predikcí numerických dat. Ovšem v praxi je zapotřebí pracovat i s dokumenty psanými v přirozeném jazyce. I v takových případech najde scikit-le

14 nov. 2024, 00:10:05 | root.cz
NUMA pro Raspberry Pi 4 a 5 přináší vyšší výkon ve více vláknech

Zavedení emulace NUMA zvyšuje výkon u Raspberry Pi 4 a 5 průměrně až o 46 % ve vícevláknových úlohách. Použití emulace NUMA dokáže patrně lépe využít paměťový řadič v SoC Broadcom nebo paměť samotnou.

14 nov. 2024, 00:10:03 | root.cz
Softwarová sklizeň (13. 11. 2024): upravujte web přímo za provozu

Pravidelná středeční sonda do světa software. Dnes se společně podíváme na vizuální editor webových aplikací, vytrénujeme si jazykový model a nakonec si necháme vytvořit odhad spotřeby energie. https:

13 nov. 2024, 00:50:04 | root.cz
Univerzitní eduroam pouze na IPv6: CLAT, DHCPv6 a logování

Na Univerzitě Pardubice jsme se rozhodli nasadit IPv6 only síť na eduroamu. Získané zkušenosti nyní sdílím, protože mi při práci chyběl komplexní návod, který by spojil jednotlivé služby do jednoho ře

13 nov. 2024, 00:50:02 | root.cz
Programování zvukových karet s čipem OPL 3: modifikace tvaru vlny a zvukové kanály se čtyřmi operátory

Dnes si ukážeme další možnosti čipu OPL3, zejména použití nových podporovaných tvarů vln (waveform) a taktéž režim propojení čtyř operátorů, které vytvoří jediný kanál. https://www.root.cz/clanky/prog

11 nov. 2024, 23:20:07 | root.cz