25 geriausi ETL testavimo interviu klausimai ir atsakymai

Toliau pateikiami dažnai užduodami klausimai interviu naujokams, taip pat patyrusiems ETL testuotojams ir kūrėjams.

1) Kas yra ETL?

Duomenų sandėliavimo architektūroje ETL yra svarbus komponentas, valdantis bet kokio verslo proceso duomenis. ETL reiškia Išgauti, transformuoti ir Įkelti . Ištrauka atlieka duomenų skaitymo iš duomenų bazės procesą. „Transform“ konvertuoja duomenis į formatą, kuris galėtų būti tinkamas ataskaitoms ir analizei. Nors įkėlimas atlieka duomenų įrašymo į tikslinę duomenų bazę procesą.

2) Paaiškinkite, ką apima ETL testavimo operacijos?

ETL testavimas apima

  • Patikrinkite, ar duomenys tinkamai transformuojami pagal verslo reikalavimus
  • Patikrinkite, ar suplanuoti duomenys įkeliami į duomenų saugyklą be sutrumpinimo ir duomenų praradimo
  • Įsitikinkite, kad ETL programa praneša apie neteisingus duomenis ir pakeičia juos numatytosiomis reikšmėmis
  • Norėdami pagerinti mastelį ir našumą, įsitikinkite, kad duomenys įkeliami numatytu laiku

3) Paminėkite, kokios yra duomenų saugyklos programų rūšys ir kuo skiriasi duomenų gavyba nuo duomenų saugojimo?

Duomenų saugyklos programų tipai yra

  • Informacijos apdorojimas
  • Analitinis apdorojimas
  • Duomenų gavyba

Duomenų gavyba gali būti apibrėžiama kaip paslėptos nuspėjamos informacijos išgavimo iš didelių duomenų bazių procesas ir duomenų aiškinimas, o duomenų saugojimas gali greičiau panaudoti duomenų kasyklą analitiniam duomenų apdorojimui. Duomenų sandėliavimas yra duomenų iš kelių šaltinių sujungimo į vieną bendrą saugyklą procesas

4) Kokios įvairios priemonės naudojamos ETL?

  • „Cognos“ sprendimų srautas
  • „Oracle“ sandėlio kūrėjas
  • Verslo objektai XI
  • SAS verslo sandėlis
  • SAS Enterprise ETL serveris

5) Kas yra faktas? Kokios yra faktų rūšys?

Tai yra pagrindinis daugialypio modelio komponentas, kuriame yra analizuojamos priemonės. Faktai yra susiję su matmenimis.

Faktų rūšys yra

  • Papildomi faktai
  • Pusiau adityvūs faktai
  • Ne papildomi faktai

6) Paaiškinkite, kas yra kubai ir OLAP kubai?

Kubai yra duomenų apdorojimo įrenginiai, sudaryti iš duomenų saugyklos faktų lentelių ir matmenų. Tai suteikia daugialypę analizę.

OLAP reiškia internetinį analizės apdorojimą, o OLAP kubas saugo didelius duomenis daugialypės formos ataskaitų teikimo tikslais. Jį sudaro faktai, vadinami matmenimis, suskirstytais pagal matmenis.

7) Paaiškinkite, kas yra sekimo lygis ir kokie yra jo tipai?

Sekimo lygis yra žurnalo failuose saugomų duomenų kiekis. Stebėjimo lygį galima suskirstyti į du normalius ir daugiažodžius. Įprastas lygis išsamiai paaiškina sekimo lygį, o išsamiai paaiškina atsekimo lygius kiekvienoje eilutėje.

8) Paaiškinkite, kas yra fakto grūdas?

Grūdų faktą galima apibrėžti kaip lygį, kuriame saugoma faktų informacija. Jis taip pat žinomas kaip faktų detalumas

9) Paaiškinkite, kas yra faktų schema ir kas yra priemonės?

Faktų lentelė be priemonių yra žinoma kaip faktų lentelė. Jis gali peržiūrėti įvykių skaičių. Pavyzdžiui, jis naudojamas įrašyti įvykius, pvz., Darbuotojų skaičių įmonėje.

Skaitiniai duomenys, pagrįsti faktų lentelės stulpeliais, yra žinomi kaip priemonės

10) Paaiškinkite, kas yra transformacija?

Transformacija yra saugyklos objektas, kuris generuoja, modifikuoja ar perduoda duomenis. Transformacijos yra dviejų tipų - aktyvios ir pasyvios

11) Paaiškinkite „Lookup Transformation“ naudojimą?

„Lookup Transformation“ yra naudinga

  • Susijusios vertės gavimas iš lentelės naudojant stulpelio reikšmę
  • Atnaujinkite pamažu besikeičiančią matmenų lentelę
  • Patikrinkite, ar lentelėje jau yra įrašų

12) Paaiškinkite, kas yra skaidymas, maišos skaidymas ir apvalus skaidymas?

Siekiant pagerinti našumą, operacijos yra padalintos, tai vadinama skaidymu. Dalijimasis leidžia „Informatica Server“ sukurti kelis ryšius su įvairiais šaltiniais

Pertvarų tipai yra

„Round-Robin“ skaidymas:

  • Pagal informatiką duomenys tolygiai pasiskirsto tarp visų skaidinių
  • Šis skaidymas taikomas kiekvienam skaidiniui, kuriame apdorojamų eilučių skaičius yra maždaug vienodas

Hash skaidymas:

  • Norėdami suskirstyti raktus, kad sugrupuotų duomenis tarp skaidinių, „Informatica“ serveris taiko maišos funkciją
  • Jis naudojamas užtikrinant, kad procesų eilučių grupės su tuo pačiu skaidymo raktu tame pačiame skaidinyje turi būti užtikrintos

13) Paminėkite, koks yra „DataReader Destination Adapter“ naudojimo pranašumas?

„DataReader“ paskirties adapterio naudojimo pranašumas yra tas, kad jis užpildo ADO įrašų rinkinys (sudaryti iš įrašų ir stulpelių) atmintyje ir atskleidžia „DataFlow“ užduoties duomenis, įdiegdami „DataReader“ sąsają, kad kita programa galėtų naudoti duomenis.

14) Kokie galimi lentelės atnaujinimo būdai naudojant SSIS (SQL Server Integration Service)?

Norėdami atnaujinti lentelę naudodami SSIS, galimi šie būdai:

  • Naudokite SQL komandą
  • Naudokite sustojimo stalą
  • Naudokite talpyklą
  • Naudokite scenarijaus užduotį
  • Atnaujinimui naudokite visą duomenų bazės pavadinimą, jei naudojamas MSSQL

15) Jei ieškote ne OLEDB (objektų susiejimo ir įterpimo duomenų bazės) šaltinio, ką darytumėte?

Jei peržiūrai turite ne OLEBD šaltinį, turite naudoti talpyklą duomenims įkelti ir naudoti kaip šaltinį

16) Kokiu atveju naudojate dinaminę talpyklą ir statinę talpyklą prijungtose ir neprijungtose transformacijose?

  • Dinaminė talpykla naudojama, kai reikia atnaujinti pagrindinę lentelę ir lėtai keisti 1 tipo matmenis (SCD)
  • Plokščiams failams naudojama statinė talpykla

17) Paaiškinkite, kuo skiriasi „Unconnected“ ir „Connected“ peržvalgos?

Prijungta paieška

Neprijungta paieška

  • Susieta paieška dalyvauja kartografavime

- Jis naudojamas, kai kartografavimo metu vietoj išraiškos transformacijos naudojama paieškos funkcija

  • Galima grąžinti kelias vertes

- Grąžina tik vieną išvesties prievadą

  • Jis gali būti prijungtas prie kitų transformacijų ir grąžina vertę
  • Negalima prijungti kitos transformacijos
  • Sujungtai paieškai galima naudoti statinę arba dinaminę talpyklą
  • Neprisijungta kaip tik statinė talpykla
  • Prijungta peržiūra palaiko vartotojo nustatytas numatytas reikšmes
  • Nesujungta paieška nepalaiko vartotojo nustatytų numatytųjų verčių
  • „Connected Lookup“ kelis stulpelius galima grąžinti iš tos pačios eilutės arba įterpti į dinaminės peržiūros talpyklą
  • Neprijungta paieška nurodo vieną grąžinimo prievadą ir grąžina vieną stulpelį iš kiekvienos eilutės

18) Paaiškinkite, kas yra duomenų šaltinio rodinys?

Duomenų šaltinio rodinys leidžia apibrėžti santykių schemą, kuri bus naudojama analizės paslaugų duomenų bazėse. Užuot tiesiogiai iš duomenų šaltinio objektų, matmenys ir kubeliai sukuriami iš duomenų šaltinio rodinių.

19) Paaiškinkite, kuo skiriasi OLAP įrankiai ir ETL įrankiai?

Skirtumas tarp ETL ir OLAP įrankio yra tas

ETL įrankis skirtas duomenims išgauti iš senų sistemų ir įkelti į nurodytą duomenų bazę naudojant tam tikrą duomenų valymo procesą.

Pavyzdys: duomenų etapas, „Informatica“ ir kt.

Nors OLAP skirtas ataskaitų teikimui OLAP duomenyse, kurie yra prieinami daugialypiu modeliu.

Pavyzdys: verslo objektai, „Cognos“ ir kt.

20) Kaip galite išgauti SAP duomenis naudodami „Informatica“?

  • Naudodami maitinimo prijungimo parinktį, galite išgauti SAP duomenis naudodami informatiką
  • Įdiekite ir sukonfigūruokite „PowerConnect“ įrankį
  • Importuokite šaltinį į šaltinio analizatorių. Tarp „Informatica“ ir „SAP Powerconnect“ veikia kaip vartai. Kitas žingsnis yra sukurti ABAP kodą žemėlapiams, tada tik informatika gali gauti duomenis iš SAP
  • Norėdami prijungti ir importuoti šaltinius iš išorinių sistemų, naudojamas „Power Connect“

21) Paminėkite, kuo skiriasi „Power Mart“ ir „Power Center“?

Maitinimo centras

Galia Mart

  • Tarkime, apdoroti didžiulį duomenų kiekį
  • Tarkime, apdoroti nedidelį duomenų kiekį
  • Jis palaiko ERP šaltinius, tokius kaip SAP, žmonės minkšti ir kt.
  • Jis nepalaiko ERP šaltinių
  • Jis palaiko vietinę ir pasaulinę saugyklą
  • Jis palaiko vietinę saugyklą
  • Jis paverčia vietinį į pasaulinę saugyklą
  • Jame nėra specifikacijų, kaip vietinę paversti pasauline saugykla

22) Paaiškinkite, kas yra sustojimo zona ir kokia yra sustojimo zonos paskirtis?

Duomenų kaupimas yra sritis, kurioje laikote duomenis laikinai duomenų saugyklos serveryje. Duomenų kaupimas apima šiuos veiksmus

  • Šaltinio duomenų gavimas ir duomenų transformavimas (restruktūrizavimas)
  • Duomenų transformacija (duomenų valymas, vertės pakeitimas)
  • Pakaitiniai raktai

23) Kas yra autobusų schema?

Įvairiems verslo procesams nustatyti bendrus matmenis naudojama BUS schema. Jame yra suderinti matmenys ir standartizuota informacijos apibrėžtis

24) Paaiškinkite, kas yra duomenų valymas?

Duomenų valymas yra duomenų ištrynimo iš duomenų saugyklos procesas. Jis ištrina nepageidaujamus duomenis kaip eilutes su nulinėmis reikšmėmis arba papildomas tarpus.

25) Paaiškinkite, kas yra schemos objektai?

Schemos objektai yra loginė struktūra, tiesiogiai susijusi su duomenų bazių duomenimis. Schemos objektai apima lenteles, rodinius, sekų sinonimus, indeksus, grupes, funkcijų paketus ir duomenų bazių nuorodas

26) Paaiškinkite šias sąvokas „Sesija“, „Darbelis“, „Mapplet“ ir „Workflow“?

  • Mapplet: Jis tvarko arba sukuria transformacijos rinkinius
  • Darbelis: Tai yra konkretus užduočių rinkinys
  • Darbo eiga: tai instrukcijų rinkinys, nurodantis serveriui, kaip atlikti užduotis
  • Sesija: Tai parametrų rinkinys, nurodantis serveriui, kaip perkelti duomenis iš šaltinių į tikslą

Nemokamas PDF atsisiuntimas: ETL testavimo interviu klausimai ir atsakymai