Umiejętność analizowania dużych zbiorów danych (Big Data) jest niezwykle gorącym tematem i zarazem jedną z najbardziej poszukiwanych umiejętności na rynku. Ponieważ cały ekosystem rozwiązań Big Data jest dość kłopotliwy w administrowaniu i zarządzaniu wiele firm decyduje się na wykorzystanie rozwiązań chmurowych. Jest to obecnie naturalny trend dla większości przedsiębiorstw, które wykorzystują analitykę Big Data.
W tym kursie wykorzystamy świetne narzędzie do analizowania danych jakim jest usługa Google BigQuery. Jest to rozwiązanie typu serverless co oznacza, że nie musimy martwić się o zarządzanie i administrowanie. Od pierwszej minuty możemy od razu przejść do pracy.
Do analizy wykorzystamy strukturalny język zapytań SQL, który jest obowiązkowym punktem w CV każdego analityka danych.
Google BigQuery
BigQuery to w pełni zarządzana hurtownia danych, która pomaga zarządzać danymi i analizować je dzięki wbudowanym funkcjom, takim jak uczenie maszynowe, analiza geoprzestrzenna i analiza biznesowa. Bezserwerowa architektura BigQuery pozwala używać zapytań SQL do odpowiadania na najbardziej zawiłe pytania przy zerowym zarządzaniu infrastrukturą. Skalowalny, rozproszony silnik analizy BigQuery umożliwia wykonywanie zapytań dotyczących terabajtów w ciągu sekund i petabajtów w ciągu minut.
BigQuery maksymalizuje elastyczność, oddzielając silnik obliczeniowy analizujący dane od miejsca przechowywania danych. Możesz przechowywać i analizować swoje dane w BigQuery lub użyć BigQuery do oceny swoich danych tam, gdzie się znajdują. Zaawansowane narzędzia, takie jak BigQuery ML i BI Engine, pozwalają analizować i rozumieć te dane.
Interfejsy BigQuery obejmują interfejs Google Cloud Console i narzędzie wiersza poleceń BigQuery. Deweloperzy i analitycy danych mogą korzystać z bibliotek klienckich ze znanym językiem programowania (Python, Java, JavaScript, Go), a także z REST API i RPC API BigQuery do przekształcania danych i zarządzania nimi.