logo

Ce este Redshift?

  • Redshift este un serviciu de depozit de date rapid și puternic, complet gestionat, la scară de petabyte, în cloud.
  • Clienții pot folosi Redshift pentru doar 0,25 USD pe oră, fără angajamente sau costuri inițiale, și pot scala la un petabyte sau mai mult pentru 1.000 USD pe teraoctet pe an.

OLAP

OLAP este un Sistem de procesare a analizelor online folosit de către Tura roșie .

Exemplu de tranzacție OLAP:

Să presupunem că vrem să calculăm profitul net pentru EMEA și Pacific pentru produsul radio digital. Acest lucru necesită extragerea unui număr mare de înregistrări. Următoarele sunt înregistrările necesare pentru a calcula un profit net:

  • Suma de radiouri vândute în EMEA.
  • Suma de radiouri vândute în Pacific.
  • Costul unitar al radioului în fiecare regiune.
  • Prețul de vânzare al fiecărui radio
  • Preț de vânzare - cost unitar

Interogările complexe sunt necesare pentru a prelua înregistrările prezentate mai sus. Bazele de date Data Warehousing utilizează diferite tipuri de arhitectură atât din perspectiva bazei de date, cât și din punct de vedere al infrastructurii.

Configurație Redshift

Tura roșie

Redshift este format din două tipuri de noduri:

    Un singur nod Multi-nod

Un singur nod: Un singur nod stochează până la 160 GB.

Multi-nod: Multi-nod este un nod care constă din mai multe noduri. Este de doua feluri:

    Nodul lider
    Gestionează conexiunile clientului și primește interogări. Un nod lider primește interogările de la aplicațiile client, analizează interogările și dezvoltă planurile de execuție. Se coordonează cu execuția paralelă a acestor planuri cu nodul de calcul și combină rezultatele intermediare ale tuturor nodurilor, iar apoi returnează rezultatul final la aplicația client.Nod de calcul
    Un nod de calcul execută planurile de execuție, iar apoi rezultatele intermediare sunt trimise la nodul lider pentru agregare înainte de a fi trimise înapoi la aplicația client. Poate avea până la 128 de noduri de calcul.

Să înțelegem conceptul de nod lider și noduri de calcul printr-un exemplu.

Tura roșie

Depozitul Redshift este o colecție de resurse de calcul cunoscute sub numele de noduri, iar aceste noduri sunt organizate într-un grup cunoscut sub numele de cluster. Fiecare cluster rulează într-un motor Redshift care conține una sau mai multe baze de date.

Când lansați o instanță Redshift, aceasta începe cu un singur nod de dimensiunea de 160 GB. Când doriți să creșteți, puteți adăuga noduri suplimentare pentru a profita de procesarea paralelă. Aveți un nod lider care gestionează nodurile multiple. Nodul Leader se ocupă de conexiunea client, precum și de nodurile de calcul. Stochează datele în noduri de calcul și efectuează interogarea.

De ce Redshift este de 10 ori mai rapid

Redshift-ul este de 10 ori mai rapid din următoarele motive:

    Stocare de date pe coloană
    În loc să stocheze datele ca o serie de rânduri, Amazon Redshift organizează datele după coloană. Sistemele bazate pe rânduri sunt ideale pentru procesarea tranzacțiilor, în timp ce sistemele bazate pe coloane sunt ideale pentru depozitarea și analiza datelor, unde interogările implică adesea agregate efectuate pe seturi mari de date. Deoarece numai coloanele implicate în interogări sunt procesate și datele coloane sunt stocate într-un mediu de stocare secvențial, sistemele bazate pe coloane necesită mai puține I/O-uri, îmbunătățind astfel performanța interogărilor.Compresie avansată
    Depozitele de date pe coloană pot fi comprimate mult mai mult decât depozitele de date bazate pe rând, deoarece date similare sunt stocate secvenţial pe disc. Amazon Redshift utilizează mai multe tehnici de compresie și poate realiza adesea o compresie semnificativă în comparație cu depozitele tradiționale de date relaționale.
    Amazon Redshift nu necesită indici sau vizualizări materializate, așa că necesită mai puțin spațiu decât sistemele tradiționale de baze de date relaționale. Atunci când încărcați date într-un tabel gol, Amazon Redshift prelevă automat datele dvs. și selectează cea mai potrivită tehnică de compresie.Procesare masiv paralelă
    Amazon Redshift distribuie automat datele și încarcă interogarea pe diferite noduri. Un Amazon Redshift facilitează adăugarea de noi noduri în depozitul dvs. de date, iar acest lucru ne permite să obținem performanțe mai rapide de interogare pe măsură ce depozitul dvs. de date crește.

Caracteristici Redshift

Caracteristicile Redshift sunt prezentate mai jos:

cât de inventată școala
Tura roșie
    Ușor de configurat, implementat și gestionat
      Aprovizionare automată
      Redshift este ușor de configurat și de utilizat. Puteți implementa un nou depozit de date cu doar câteva clicuri în Consola AWS, iar Redshift asigură automat infrastructura pentru dvs. În AWS, toate sarcinile administrative sunt automatizate, cum ar fi backup-urile și replicarea, trebuie să vă concentrați pe datele dvs., nu pe administrare.Backup-uri automate
      Redshift face backup automat pentru datele dvs. pe S3. De asemenea, puteți replica instantaneele în S3 într-o altă regiune pentru orice recuperare în caz de dezastru.
    Eficient din punct de vedere al costurilor
      Fără costuri inițiale, plătiți pe măsură ce mergeți
      Amazon Redshift este cel mai rentabil serviciu de depozit de date, deoarece trebuie să plătiți doar pentru ceea ce utilizați.
      Costurile sale încep cu 0,25 USD pe oră, fără angajament și fără costuri inițiale și se pot extinde la 250 USD pe teraoctet pe an.
      Amazon Redshift este singurul serviciu de depozit de date care oferă prețuri la cerere fără costuri inițiale și oferă, de asemenea, prețuri pentru instanțe rezervate, care economisesc până la 75%, oferind un termen de 1-3 ani.Alegeți tipul de nod.
      Puteți alege oricare dintre cele două noduri pentru a optimiza Redshift-ul.
        Nod dens de calcul
        Nodul dens de calcul poate crea depozite de date de înaltă performanță folosind procesoare rapide, o cantitate mare de RAM și discuri cu stare solidă.Nod de stocare dens
        Dacă doriți să reduceți costul, atunci puteți utiliza nodul de stocare Dense. Acesta creează un depozit de date rentabil prin utilizarea unui hard disk mai mare.
    Scalați rapid pentru a vă satisface nevoile.
      Depozitare de date la scară petabyte
      Amazon Redshift crește sau reduce automat nodurile în funcție de schimbările necesare. Cu doar câteva clicuri în Consola AWS sau un singur apel API, puteți schimba cu ușurință numărul de noduri dintr-un depozit de date.Analiza lacului de date la scară exabyte
      Este o caracteristică a Redshift care vă permite să rulați interogări împotriva exaocteților de date în Amazon S3. Amazon S3 este un sistem de date sigur și rentabil pentru a stoca date nelimitate într-un format deschis.Concurență nelimitată
      Este o caracteristică a Redshift înseamnă că interogările multiple pot accesa aceleași date în Amazon S3. Vă permite să rulați interogări pe mai multe noduri, indiferent de complexitatea unei interogări sau de cantitatea de date.
    Interogați lacul dvs. de date
    Amazon Redshift este singurul depozit de date care este folosit pentru a interoga lacul de date Amazon S3 fără a încărca date. Acest lucru oferă flexibilitate prin stocarea datelor accesate frecvent în Redshift și a datelor nestructurate sau accesate rar în Amazon S3.Sigur
    Cu câteva setări de parametri, puteți seta Redshift-ul să utilizeze SSL pentru a vă securiza datele. De asemenea, puteți activa criptarea, toate datele scrise pe disc vor fi criptate.Performanță mai rapidă
    Amazon Redshift oferă stocare, compresie și procesare paralelă a datelor în coloană pentru a reduce cantitatea de I/O necesară pentru a efectua interogări. Acest lucru îmbunătățește performanța interogărilor.