top 29 data engineer interview questions
Lista celor mai frecvente întrebări și răspunsuri la interviul inginerului de date pentru a vă ajuta să vă pregătiți pentru următorul interviu:
Astăzi, ingineria de date este cel mai căutat domeniu după dezvoltarea de software și a devenit una dintre opțiunile de muncă cu cea mai rapidă creștere din lume. Intervievatorii își doresc cei mai buni ingineri de date pentru echipa lor și de aceea au tendința de a intervieva cu atenție candidații. Ei caută anumite abilități și cunoștințe. Deci, trebuie să fii pregătit în consecință pentru a le îndeplini așteptările.
Ce veți învăța:
- Responsabilitățile unui inginer de date
- Abilitățile unui inginer de date
- Întrebări frecvente despre interviul inginerului de date
- Concluzie
Responsabilitățile unui inginer de date
Responsabilitățile includ:
- Pentru a gestiona și supraveghea datele din cadrul companiei.
- Întrețineți și gestionați sistemul sursă al datelor și zonele intermediare.
- Simplificați curățarea datelor împreună cu construirea ulterioară și îmbunătățirea reduplicării datelor.
- Puneți la dispoziție și executați atât transformarea datelor, cât și procesul ETL.
- Extragerea și realizarea interogării de date ad-hoc.
Abilitățile unui inginer de date
Cu calificări, aveți nevoie și de anumite abilități. Ambele sunt cruciale atunci când vă pregătiți pentru poziția de inginer de date. Aici, enumerăm primele 5 abilități, în nici o ordine specială, de care va trebui să deveniți un inginer de date de succes.
- Abilități în vizualizarea datelor.
- Python și SQL.
- Cunoașterea modelării datelor atât pentru Big Data, cât și pentru Data Warehousing
- Matematică
- Know-how în ETL
- Experiență spațială Big Data
Deci, trebuie să lucrați la îmbunătățirea acestor seturi de abilități înainte de a începe să vă pregătiți pentru interviu. Și când v-ați lustruit abilitățile, iată câteva întrebări de interviu pe care le puteți pregăti pentru a-i determina pe intervievatori să vă ia în seamă și să vă angajeze și pe dumneavoastră.
Întrebări frecvente despre interviul inginerului de date
Întrebări generale de interviu
Q # 1) De ce ați studiat ingineria datelor?
Răspuns: Această întrebare își propune să afle despre educația, experiența de lucru și experiența dvs. S-ar putea să fi fost o alegere firească în continuarea diplomei dvs. în sisteme informaționale sau informatică. Sau, poate ați lucrat într-un domeniu similar sau s-ar putea să treceți dintr-o zonă de lucru complet diferită.
Oricare ar fi povestea ta, nu te abține sau nu te feri. Și, în timp ce împărtășești, evidențiază în continuare abilitățile pe care le-ai învățat pe parcurs și munca excelentă pe care ai făcut-o.
Cu toate acestea, nu începeți povestirea. Începeți puțin cu experiența dvs. educațională și apoi ajungeți la partea când știați că doriți să fiți inginer de date. Și apoi continuați cum ajungeți aici.
Î. # 2) Care este cel mai greu lucru în legătură cu a deveni inginer de date, potrivit dvs.?
Răspuns: Trebuie să răspundeți sincer la această întrebare. Nu fiecare aspect al tuturor locurilor de muncă este ușor și intervievatorul dvs. știe asta. Scopul acestei întrebări nu este să vă identificați slăbiciunea, ci să știți cum lucrați prin lucruri cu care vă este greu să vă ocupați.
Puteți spune ceva de genul: „În calitate de inginer de date, îmi este greu să finalizez solicitarea tuturor departamentelor dintr-o companie în care majoritatea dintre ele vin deseori cu cerințe contradictorii. Deci, de multe ori mi se pare dificil să le echilibrez în consecință.
Dar mi-a oferit o perspectivă valoroasă asupra funcționării departamentelor și a rolului pe care îl joacă în structura generală a companiei. ” Și acesta este doar un exemplu. Puteți și ar trebui să vă puneți punctul de vedere.
Î. 3) Spuneți-ne un incident în care trebuia să reuniți date din diferite surse, dar ați confruntat cu probleme neașteptate și cum ați rezolvat-o?
Răspuns: Această întrebare este o oportunitate pentru dvs. de a vă demonstra abilitățile de rezolvare a problemelor și modul în care vă adaptați la schimbările bruște ale planului. Întrebarea ar putea fi abordată în general sau în mod specific în contextul ingineriei datelor. Dacă nu ați trecut printr-o astfel de experiență, puteți oferi un răspuns ipotetic.
Iată un exemplu de răspuns: „În compania mea de franciză anterioară, eu și echipa mea trebuiau să colectăm date din diferite locații și sisteme. Dar una dintre francize și-a schimbat sistemul fără să ne dea o notificare prealabilă. Acest lucru a dus la o mână de probleme pentru colectarea și prelucrarea datelor.
Pentru a rezolva acest lucru, a trebuit să venim mai întâi cu o soluție rapidă pe termen scurt pentru a obține datele esențiale în sistemul companiei. Și după aceea, am dezvoltat o soluție pe termen lung pentru a împiedica astfel de probleme să se repete. ”
Î. # 4) În ce fel diferă meseria de inginer de date de cea a unui arhitect de date?
Răspuns: Această întrebare este menită să verifice dacă înțelegeți că există diferențe în cadrul echipei unui depozit de date. Nu puteți greși cu răspunsul. Responsabilitățile ambelor se suprapun sau variază în funcție de ceea ce are nevoie departamentul de întreținere a bazei de date sau compania.
Puteți spune că „conform experienței mele, diferența dintre rolurile unui inginer de date și a unui arhitect de date variază de la o companie la alta. Deși lucrează foarte strâns împreună, există diferențe în responsabilitățile lor generale.
Gestionarea serverelor și construirea arhitecturii sistemului de date al unei companii este responsabilitatea unui arhitect de date. Și munca unui inginer de date este de a testa și menține acea arhitectură. Odată cu aceasta, noi, inginerii de date, ne asigurăm că datele puse la dispoziția analiștilor sunt de înaltă calitate și fiabile. ”
Întrebări de interviuri tehnice
Q # 5) Care sunt cele patru V-uri ale Big Data?
(imagine sursă )
Răspuns:
Cele patru V ale Big Data sunt:
- Primul V este Viteză care se referă la rata la care Big Data este generată în timp. Deci, poate fi considerat ca analizând datele.
- Al doilea V este varietate a diferitelor forme de Big Data, fie în imagini, fișiere jurnal, fișiere media și înregistrări vocale.
- Al treilea V este Volum a datelor. Poate fi în numărul de utilizatori, numărul de tabele, dimensiunea datelor sau numărul de înregistrări.
- Al patrulea V este Veridicitatea legat de incertitudinea sau certitudinea datelor. Cu alte cuvinte, decide cât de sigur puteți fi cu privire la acuratețea datelor.
Q # 6) În ce fel diferă datele structurate de datele nestructurate?
Răspuns: Tabelul de mai jos explică diferențele:
Date structurate | Date nestructurate | |
---|---|---|
7) | Datele agregate sunt conținute într-o singură dimensiune. | Datele sunt împărțite în diferite tabele de dimensiuni. |
1) | Poate fi stocat în MS Access, Oracle, SQL Server și alte sisteme tradiționale de baze de date similare. | Nu poate fi stocat într-un sistem tradițional de baze de date. |
Două) | Poate fi stocat în diferite coloane și rânduri. | Nu poate fi stocat în rânduri și coloane. |
3) | Un exemplu de date structurate sunt tranzacțiile cu aplicații online. | Exemple de date nestructurate sunt Tweets, căutări Google, aprecieri pe Facebook etc. |
4) | Poate fi definit cu ușurință în cadrul modelului de date. | Nu poate fi definit în funcție de modelul de date. |
5) | Vine cu o dimensiune și un conținut fix. | Vine în diferite dimensiuni și conținut. |
Q # 7) Cu ce instrumente ETL sunteți familiarizați?
Răspuns: Numiți toate instrumentele ETL cu care ați lucrat. Puteți spune: „Am lucrat cu SAS Data Management, IBM Infosphere și SAP Data Services. Dar preferatul meu este PowerCenter de la Informatica. Este eficient, are o rată extrem de performantă și este flexibil. Pe scurt, are toate proprietățile importante ale unui instrument ETL bun.
Acestea derulează fără probleme operațiunile de date comerciale și garantează accesul la date chiar și atunci când au loc schimbări în afaceri sau în structura acesteia. ” Asigurați-vă că vorbiți doar despre cele cu care ați lucrat și cele cu care vă place să lucrați. Sau, s-ar putea să-ți rezerve interviul ulterior.
Q # 8) Spuneți-ne despre schemele de proiectare ale modelării datelor.
Răspuns: Modelarea datelor vine cu două tipuri de scheme de proiectare.
Acestea sunt explicate după cum urmează:
- Primul este Program de stele , care este împărțit în două părți - tabelul de fapte și tabelul de dimensiuni. Aici, ambele tabele sunt conectate. Schema de stele este cel mai simplu stil de schemă de date mart și este abordată cel mai pe larg. Se numește astfel deoarece structura sa seamănă cu o stea.
- Al doilea este Schema fulgului de zăpadă care este extensia schemei stelare. Acesta adaugă dimensiuni suplimentare și se numește fulg de zăpadă, deoarece structura sa seamănă cu cea a unui fulg de zăpadă.
Q # 9) Care este diferența dintre schema stelară și schema fulgului de zăpadă?
(imagine sursă )
Răspuns: Tabelul de mai jos explică diferențele:
Program de stele | Schema fulgului de zăpadă | |
---|---|---|
1) | Tabelul de dimensiuni conține ierarhiile dimensiunilor. | Există tabele separate pentru ierarhii. |
Două) | Aici tabelele de dimensiuni înconjoară un tabel de date. | Tabelele de cote înconjoară un tabel de date și apoi sunt înconjurate în continuare de tabele de cote. |
3) | Un tabel de date și orice tabel de dimensiuni sunt conectate printr-o singură îmbinare. | Pentru a prelua datele, este nevoie de multe asocieri. |
4) | Acesta vine cu un design simplu de DB. | Are un design complex de DB. |
5) | Funcționează bine chiar și cu interogări și structuri de date denormalizate. | Funcționează numai cu structura de date normalizată. |
6) | Redundanță de date - mare. | Redundanță de date - foarte scăzută. |
8) | Procesare mai rapidă a cubului. | Unirea complexă încetinește procesarea cubului. |
Q # 10) Care este diferența dintre Depozitul de date și baza de date operațională?
Răspuns: Tabelul de mai jos explică diferențele:
Depozit de date | Baza de date operațională | |
---|---|---|
7) | Suportă o mână de OLTP, cum ar fi clienții concurenți. | Sprijină mulți clienți concurenți. |
1) | Acestea sunt concepute pentru a sprijini procesarea analitică a volumului mare. | Acestea susțin procesarea tranzacțiilor cu volum mare. |
Două) | Datele istorice afectează un depozit de date. | Datele actuale afectează baza de date operațională. |
3) | Datele noi, non-volatile sunt adăugate în mod regulat, dar rămân rareori modificate. | Datele sunt actualizate în mod regulat pe măsură ce apare nevoia. |
4) | Este conceput pentru analiza măsurilor de afaceri în funcție de atribute, domenii și categorii. | Este conceput pentru procesare în timp real și tranzacții comerciale. |
5) | Optimizat pentru sarcini grele și interogări complexe care accesează mai multe rânduri la fiecare masă. | Optimizat pentru un set simplu de tranzacții, cum ar fi preluarea și adăugarea unui rând la rând pentru fiecare tabel. |
6) | Este plin de informații valide și consecvente și nu are nevoie de validare în timp real. | Îmbunătățit pentru validarea informațiilor primite și utilizează tabele de date de validare. |
8) | Sistemele sale sunt în principal orientate spre subiect. | Sistemele sale sunt în principal orientate spre proces. |
9) | Date iesire. | Date de intrare. |
10) | Se poate accesa un număr imens de date. | Se poate accesa un număr limitat de date. |
unsprezece) | Creat pentru OLAP, procesare analitică on-line. | Creat pentru OLTP, procesare tranzacții on-line. |
Q # 11) Indicați diferența dintre OLTP și OLAP.
Răspuns: Tabelul de mai jos explică diferențele:
OLTP | OLAP | |
---|---|---|
7) | Volumul de date nu este foarte mare. | Are un volum mare de date. |
1) | Folosit pentru gestionarea datelor operaționale. | Folosit pentru gestionarea datelor informaționale. |
Două) | Clienții, funcționarii și profesioniștii IT îl folosesc. | Managerii, analiștii, directorii și alți angajați ai cunoștințelor îl folosesc. |
3) | Este orientat spre client. | Este orientat spre piață. |
4) | Gestionează datele actuale, cele care sunt extrem de detaliate și sunt utilizate pentru luarea deciziilor. | Gestionează o cantitate imensă de date istorice. De asemenea, oferă facilități pentru agregare și rezumare, împreună cu gestionarea și stocarea datelor la diferite niveluri de granularitate. Prin urmare, datele devin mai confortabile pentru a fi utilizate în luarea deciziilor. |
5) | Are o dimensiune a bazei de date de 100 MB-GB. | Are o dimensiune de bază de date de 100 GB-TB. |
6) | Folosește un model de date ER (entitate-relație) împreună cu un proiect de bază de date orientat spre aplicație. | OLAP folosește fie un model de fulgi de zăpadă, fie o stea, împreună cu un design de baze de date orientat către subiect. |
8) | Mod acces - Citire / Scriere. | Modul de acces este în mare parte scris. |
9) | Complet normalizat. | Parțial normalizat. |
10) | Viteza sa de procesare este foarte rapidă. | Viteza sa de procesare depinde de numărul de fișiere pe care le conține, de interogări complexe și de actualizarea datelor de lot |
Q # 12) Explicați conceptul principal din spatele Cadrului Apache Hadoop.
Răspuns: Se bazează pe algoritmul MapReduce. În acest algoritm, pentru a procesa un set imens de date, se utilizează operații de hartă și reducere. Harta, filtrează și sortează datele în timp ce Reduceți, rezumă datele. Scalabilitatea și toleranța la erori sunt punctele cheie ale acestui concept. Putem realiza aceste caracteristici în Apache Hadoop implementând eficient MapReduce și Multi-threading.
Q # 13) Ați lucrat vreodată cu Hadoop Framework?
(imagine sursă )
Răspuns: Mulți manageri de angajare întreabă despre instrumentul Hadoop în cadrul interviului pentru a ști dacă sunteți familiarizați cu instrumentele și limbile folosite de companie. Dacă ați lucrat cu Hadoop Framework, spuneți-le detaliile proiectului dvs. pentru a aduce în lumină cunoștințele și abilitățile dvs. cu instrumentul și capacitățile acestuia. Și dacă nu ați lucrat vreodată cu acesta, vor funcționa și unele cercetări pentru a arăta o anumită familiaritate cu atributele sale.
Poti spune, de exemplu, „În timp ce lucram la un proiect de echipă, am avut șansa să lucrez cu Hadoop. Ne-am concentrat pe creșterea eficienței procesării datelor, așa că, datorită capacității sale de a crește viteza de procesare a datelor fără a compromite calitatea în timpul procesării distribuite, am decis să folosim Hadoop.
Și, deoarece compania mea anterioară se aștepta la o creștere considerabilă a procesării datelor în următoarele câteva luni, scalabilitatea sa a fost utilă și. Hadoop este, de asemenea, o rețea open-source bazată pe Java, care o face cea mai bună opțiune pentru proiectele cu resurse limitate și una ușor de utilizat, fără nicio pregătire suplimentară. ”
cum se reprezintă un grafic în java
Q # 14) Menționați câteva caracteristici importante ale Hadoop.
Răspuns: Caracteristicile sunt după cum urmează:
- Hadoop este un cadru open source gratuit în care putem modifica codul sursă conform cerințelor noastre.
- Suportă procesarea mai rapid distribuită a datelor. HDFS Hadoop stochează date într-o manieră distribuită și folosește MapReduce pentru a procesa datele în paralel.
- Hadoop este extrem de tolerant și implicit, la diferite noduri, permite utilizatorului să creeze trei replici ale fiecărui bloc. Deci, dacă unul dintre noduri nu reușește, putem recupera datele de la un alt nod.
- De asemenea, este scalabil și este compatibil cu multe hardware.
- Deoarece Hadoop a stocat date în clustere, independent de toate celelalte operațiuni. Prin urmare, este fiabil. Datele stocate rămân neafectate de funcționarea defectuoasă a mașinilor. Și astfel, este foarte disponibil și.
Q # 15) Cum puteți crește veniturile afacerii analizând Big Data?
Răspuns: Analiza datelor mari este o parte vitală a afacerilor, deoarece le ajută să se diferențieze între ele, împreună cu creșterea veniturilor. Analiza Big Data oferă sugestii și recomandări personalizate companiilor prin analize predictive.
De asemenea, ajută companiile să lanseze produse noi pe baza preferințelor și nevoilor clienților. Acest lucru ajută companiile să câștige semnificativ mai mult, cu aproximativ 5-20% mai mult. Companii precum Bank of America, LinkedIn, Twitter, Walmart, Facebook etc. folosesc Big Data Analysis pentru a-și crește veniturile.
Q # 16) În timp ce implementați o soluție Big Data, ce pași trebuie să urmați?
Răspuns: Există trei pași care trebuie urmați în timpul implementării unei soluții Big Data:
- Ingerare date- Este primul pas în implementarea unei soluții Big Data. Este extragerea datelor din diverse surse, cum ar fi SAP, MYSQL, Salesforce, fișiere jurnal, baze de date interne, etc. Ingerarea datelor poate avea loc prin streaming în timp real sau joburi batch.
- Stocare a datelor- După ce datele sunt ingerate, datele extrase ar trebui stocate undeva. Este fie stocat în baze de date HDFS, fie NoSQL. HDFS funcționează bine pentru acces secvențial prin HBase pentru acces aleatoriu de citire sau scriere.
- Procesarea datelor- Acesta este al treilea și ultimul pas pentru implementarea unei soluții Big Data. După stocare, datele sunt procesate printr-unul dintre cadrele principale, cum ar fi MapReduce sau Pig.
Q # 17) Ce este un scaner de blocuri în HDFS?
Răspuns: Un bloc este cantitatea minimă de date care poate fi scrisă sau citită în HDFS. 64 MB este dimensiunea implicită a unui bloc.
Scannerul de blocuri este un program care urmărește periodic numărul de blocuri pe un DataNode, împreună cu verificarea acestora pentru eventualele erori ale sumelor de verificare și corupția datelor.
Î.18) Care sunt provocările cu care v-ați confruntat în momentul în care ați introdus noi aplicații de analiză a datelor dacă ați introdus vreodată una?
Răspuns: Dacă nu ați introdus niciodată noi analize de date, puteți spune pur și simplu acest lucru. Deoarece sunt destul de scumpe și, prin urmare, nu adesea companiile fac asta. Dar dacă o companie decide să investească în ea, poate fi un proiect extrem de ambițios. Ar avea nevoie de angajați foarte pregătiți pentru a instala, conecta, utiliza și întreține aceste instrumente.
Deci, dacă ați trecut vreodată prin proces, spuneți-le ce obstacole v-ați confruntat și cum le-ați depășit. Dacă nu ați făcut-o, spuneți-le în detaliu ce știți despre proces. Această întrebare determină dacă aveți cunoștințele de bază pentru a rezolva problemele care ar putea apărea în timpul introducerii noilor aplicații de analiză a datelor.
Exemplu de răspuns; „Am făcut parte din introducerea de noi analize de date în compania mea anterioară. Întregul proces este elaborat și are nevoie de un proces bine planificat pentru o tranziție cât mai lină.
Cu toate acestea, chiar și cu o planificare imaculată, nu putem evita întotdeauna circumstanțe și probleme neprevăzute. O astfel de problemă a fost o cerere incredibil de mare de licențe de utilizator. A depășit ceea ce ne așteptam. Pentru obținerea licențelor suplimentare, compania a trebuit să realoce resursele financiare.
De asemenea, instruirea trebuia planificată astfel încât să nu împiedice fluxul de lucru. De asemenea, a trebuit să optimizăm infrastructura pentru a sprijini numărul mare de utilizatori. ”
Q # 19) Ce se întâmplă dacă NameNode se blochează în clusterul HDFS?
Răspuns: Clusterul HDFS are un singur NameNode și menține metadatele DataNode. A avea un singur NameNode oferă clusterelor HDFS un singur punct de eșec.
Deci, dacă NameNode se blochează, sistemele ar putea deveni indisponibile. Pentru a preveni acest lucru, putem specifica un NameNode secundar care ia punctele de control periodice în sistemele de fișiere HDFS, dar nu este o copie de rezervă a NameNode. Dar îl putem folosi pentru a recrea NameNode și a reporni.
Q # 20) Diferența dintre NAS și DAS în clusterul Hadoop.
Răspuns: În NAS, straturile de stocare și calcul sunt separate, iar apoi stocarea este distribuită între diferite servere din rețea. În timp ce se află în DAS, stocarea este de obicei atașată nodului de calcul. Apache Hadoop se bazează pe principiul procesării în apropierea unei anumite locații de date.
Prin urmare, discul de stocare ar trebui să fie local pentru calcul. DAS vă ajută să obțineți performanță pe un cluster Hadoop și poate fi utilizat pe hardware de marfă. În cuvinte simple, este mai rentabil. Spațiul de stocare NAS este preferat cu o lățime de bandă mare de aproximativ 10 GbE.
Q # 21) Este mai bună construirea unei baze de date NoSQL decât construirea unei baze de date relaționale?
(imagine sursă )
Răspuns: Ca răspuns la această întrebare, trebuie să vă prezentați cunoștințele despre ambele baze de date. De asemenea, trebuie să faceți o copie de rezervă cu un exemplu de situație care să demonstreze cum veți sau ați aplicat know-how-ul într-un proiect real.
Răspunsul dvs. ar putea fi ceva de genul „În unele situații, ar putea fi benefic să construiți o bază de date NoSQL. În ultima mea companie, când sistemul de franciză a crescut exponențial în dimensiune, a trebuit să ne extindem rapid pentru a profita la maximum de toate datele operaționale și de vânzări pe care le aveam.
Scalarea este mai bună decât extinderea cu servere mai mari atunci când gestionați încărcarea crescută de procesare a datelor. Este rentabil și mai ușor de realizat cu bazele de date NoSQL, deoarece poate gestiona cu ușurință volume imense de date. Acest lucru este util atunci când trebuie să răspundeți rapid la schimbări considerabile de încărcare a datelor în viitor.
Deși bazele de date relaționale au o conectivitate mai bună la orice instrumente de analiză. Dar bazele de date NoSQL au multe de oferit. ”
Q # 22) Ce faceți atunci când întâmpinați o problemă neașteptată cu întreținerea datelor? Ați încercat vreo soluție prealabilă pentru asta?
Răspuns: Inevitabil, probleme neașteptate apar din când în când în fiecare sarcină de rutină, chiar și în timpul întreținerii datelor. Această întrebare își propune să știe dacă puteți face față situațiilor de înaltă presiune și cum.
Puteți spune ceva de genul „întreținerea datelor ar putea fi o sarcină de rutină, dar este vital să urmăriți cu atenție sarcinile specifice, inclusiv să vă asigurați că executarea cu succes a scripturilor.
Odată ce făceam verificarea integrității, am dat peste un indice corupt care ar fi putut provoca probleme grave în viitor. De aceea am venit cu o nouă sarcină de întreținere pentru a preveni adăugarea de indici corupți în baza de date a companiei. ”
Q # 23) Ați instruit vreodată pe cineva în domeniul dvs.? Dacă da, ce ți s-a părut cel mai provocator?
Răspuns: De obicei, inginerii de date sunt necesari pentru a-și instrui colegii cu privire la noi sisteme sau procese pe care le-ați creat sau pentru a instrui noi angajați pe sisteme și arhitectură deja existente. Deci, cu această întrebare, intervievatorul dvs. vrea să știe dacă vă puteți descurca. Dacă nu ați avut șansa de a instrui pe cineva însuși, vorbiți despre provocările pe care le-a antrenat cineva sau despre care știți că ați făcut față.
O mostră a răspunsului ideal va fi ceva de genul acesta. „Da, am avut șansa să pregătesc ambele grupuri de colegi de muncă mici și mari. Formarea de noi angajați cu experiență semnificativă într-o altă companie este cea mai provocatoare sarcină pe care am întâlnit-o. Sunt adesea atât de obișnuiți să abordeze datele dintr-o perspectivă diferită încât se luptă să accepte modul în care facem lucrurile.
Adesea, sunt extrem de opinioniști și cred că știu totul bine și de aceea le trebuie mult timp să realizeze că o problemă poate avea mai multe soluții. Încerc să-i încurajez să-și deschidă mintea și să accepte posibilități alternative subliniind cât de succes au avut arhitectura și procesele noastre. ”
Q # 24) Care sunt avantajele și dezavantajele lucrului în cloud computing?
(imagine sursă )
Răspuns:
Pro:
- Fără costuri de infrastructură.
- Management minim.
- Nu există probleme în ceea ce privește gestionarea și administrarea.
- Ușor de accesat.
- Plătește pentru ceea ce folosești.
- Este de încredere.
- Oferă controlul de date, backup și recuperare.
- Depozitare imensă.
Contra:
- Are nevoie de o conexiune bună la internet cu lățime de bandă la fel de bună pentru a funcționa bine.
- Are timpul său de nefuncționare.
- Controlul dumneavoastră asupra infrastructurii va fi limitat.
- Există puțină flexibilitate.
- Are anumite costuri continue.
- S-ar putea să existe probleme de securitate și tehnice.
Q # 25) Munca inginerilor de date este de obicei „în culise”. Te simți confortabil să lucrezi departe de „lumina reflectoarelor”?
Răspuns: Managerul dvs. de angajare vrea să știe dacă vă place lumina reflectoarelor sau puteți lucra bine în ambele situații. Răspunsul dvs. ar trebui să le spună că, deși vă place lumina reflectoarelor, vă simțiți confortabil să lucrați și în fundal.
„Ceea ce contează pentru mine este că ar trebui să fiu expert în domeniul meu și să contribui la creșterea companiei mele. Dacă trebuie să lucrez în lumina reflectoarelor, mă simt confortabil și asta. Dacă există o problemă pe care directorii trebuie să o abordeze, nu voi ezita să ridic vocea și să o aduc în atenția lor. ”
Q # 26) Ce se întâmplă atunci când scanerul Block detectează un bloc de date corupt?
Răspuns: În primul rând, rapoartele DataNode către NameNode. Apoi NameNode începe să creeze o nouă replică prin replica blocului corupt. Blocul de date deteriorat nu va fi șters dacă numărul de replici al replicilor potrivite se potrivește cu factorul de replicare.
Q # 27) Ați găsit vreodată o nouă utilizare inovatoare pentru datele deja existente? A afectat pozitiv compania?
Răspuns: Această întrebare este menită pentru ei să afle dacă sunteți auto-motivați și suficient de dornici să contribuiți la succesul proiectelor. Dacă este posibil, răspundeți la întrebare cu un exemplu în care ați preluat sarcina unui proiect sau ați venit cu o idee. Și dacă ați prezentat vreodată o soluție nouă la o problemă, nici nu o ratați.
Exemplu de răspuns: „La ultimul meu loc de muncă, am luat parte la aflarea motivului pentru care avem o rată ridicată de rotire a angajaților. Am observat îndeaproape datele de la diverse departamente unde am găsit date foarte corelate în domenii cheie, cum ar fi finanțele, marketingul, operațiunile etc. și rata de rotație a angajaților.
Am colaborat cu analiștii departamentului pentru o mai bună înțelegere a acestor corelații. Cu înțelegerea noastră, am făcut câteva schimbări strategice care au afectat pozitiv rata de rotație a angajaților. ”
Î. 28) Ce abilități non-tehnice credeți că vă sunt cele mai utile ca inginer de date?
Răspuns: Încercați să evitați cele mai evidente răspunsuri, cum ar fi comunicarea sau abilitățile interpersonale. Puteți spune că „prioritizarea și multitasking-ul au fost de multe ori utile la locul meu de muncă. Primim diverse sarcini într-o zi, deoarece lucrăm cu diferite departamente. Prin urmare, devine vital să le acordăm prioritate. Ne face munca ușoară și ne ajută să le finisăm pe toate în mod eficient. ”
Î. # 29) Care sunt unele probleme obișnuite cu care v-ați confruntat ca inginer de date?
Răspuns: Acestea sunt:
- Integrare continuă și în timp real.
- Stocarea unor cantități uriașe de date și informații din acele date.
- Constrângeri ale resurselor.
- Având în vedere ce instrumente să utilizați și care dintre acestea pot oferi cele mai bune rezultate.
Concluzie
Ingineria datelor ar putea părea o muncă plictisitoare de rutină, dar există multe fațete interesante. Acest lucru este evident din posibilele întrebări pe care ar putea să le pună intervievatorii. Ar trebui să fiți gata să răspundeți nu doar la întrebări tehnice libere, ci și la întrebări situaționale, precum cele enumerate mai sus. Doar atunci veți putea dovedi că vă puteți face bine treaba și o meritați.
Toate cele bune!!
Lectură recomandată
- Întrebări și răspunsuri la interviu
- Întrebări și răspunsuri la interviuri de testare ETL
- Top 32 Cele mai bune întrebări și răspunsuri pentru interviul Datastage
- Cele mai bune întrebări și răspunsuri la interviurile JSON
- Întrebări și răspunsuri de top pentru interviu Teradata
- Top 24 Întrebări de interviu pentru modelarea datelor cu răspunsuri detaliate
- Top 50+ Întrebări și răspunsuri pentru interviul bazei de date
- Top 30 întrebări și răspunsuri la interviu SAS