Zaawansowana analiza danych w PySpark. Metody przetwarzania informacji na szeroką skalę z wykorzystaniem Pythona i systemu Spark
Potrzeby w zakresie analizy dużych zbiorów danych i wyciągania z nich użytecznych informacji stale rosną. Spośród dostępnych narzędzi przeznaczonych do tych zastosowań szczególnie przydatny jest PySpark - interfejs API systemu Spark dla języka Python. Apache Spark świetnie się nadaje do analizy dużych zbiorów danych, a PySpark skutecznie ułatwia integrację Sparka ze specjalistycznymi narzędziami PyData. By jednak można było w pełni skorzystać z tych możliwości, konieczne jest zrozumienie interakcji między algorytmami, zbiorami danych i wzorcami używanymi w analizie danych.
Oto praktyczny przewodnik po wersji 3.0 systemu Spark, metodach statystycznych i rzeczywistych zbiorach danych. Omówiono w nim zasady rozwiązywania problemów analitycznych za pomocą interfejsu PySpark, z wykorzystaniem dobrych praktyk programowania w systemie Spark. Po lekturze można bezproblemowo zagłębić się we wzorce analityczne oparte na popularnych technikach przetwarzania danych, takich jak klasyfikacja, grupowanie, filtrowanie i wykrywanie anomalii, stosowane w genomice, bezpieczeństwie systemów IT i finansach. Dodatkowym plusem są opisy wykorzystania przetwarzania obrazów i języka naturalnego. Zaletą jest też szereg rzeczywistych przykładów dużych zbiorów danych i ich zaawansowanej analizy.
Dzięki książce poznasz:
model programowania w ekosystemie Spark
podstawowe metody stosowane w nauce o danych
pełne implementacje analiz dużych publicznych zbiorów danych
konkretne przypadki użycia narzędzi uczenia maszynowego
kod, który łatwo dostosujesz do swoich potrzeb
PySpark: systemowa odpowiedź na problemy inżyniera danych!
| Cena det. | 69,00 zł |
|---|---|
| Data wydania | 2023-01-01 |
| Rok wydania | 2023 |
| Tłumacz | Watrak Andrzej |
| Wydawca | Helion |
| Format | 16.5 x 23.5 cm |
| Liczba stron | 192 |
| Oprawa | Miękka |
| ISBN | 9788383220697 |
| EAN | 9788383220697 |
| Numer katalogowy | 554990 |
- Podana przy każdym produkcie „Dostępność” oznacza czas potrzebny do skompletowania zamówienia zawierającego dany produkt i wysłania go z magazynu. W tym przypadku dostępność nie oznacza więc przewidzianego dla danego sposobu wysyłki czasu dostawy, np. czasu potrzebnego kurierowi na dostarczenie paczki pod wskazany adres lub do punktu odbioru.
- Przykładowo „Dostępność: 1 dzień roboczy” oznacza, że dany produkt jest dostępny w naszym magazynie i zostanie wysłany do klienta w kolejnym dniu roboczym od daty złożenia zamówienia.
- Warto pamiętać, że zamówienie zawierające produkty z różnym czasem dostępności zostanie wysłane z magazynu w terminie najdalszym z podanych. Jeżeli zależy Państwu na szybkiej realizacji zamówienia, rekomendujemy wybór produktów z najkrótszym czasem dostępności.











