Wyrażenia warunkowe CASE. Wyrażenia warunkowe CASE Wyrażenie CASE jest instrukcją warunkową języka SQL

Stosowane są dwie metody:

CASE wyrażenie

Funkcja DEKODOWANIA

Dwie metody używane do zaimplementowania przetwarzania warunkowego (logika IF-THEN-ELSE) w instrukcji SQL to wyrażenie CASE i funkcja DECODE.

Uwaga: Wyrażenie CASE jest zgodne z ANSI SQL. Funkcja DECODE jest specyficzna dla składni Oracle.

CASE wyrażenie

Upraszcza zapytania warunkowe, sprawiając, że instrukcja IF-THEN-ELSE działa:

Wyrażenia CASE umożliwiają użycie logiki IF-THEN-ELSE w instrukcjach SQL bez konieczności wywoływania procedur.

W prosty sposób wyrażenie warunkowe PRZYPADEK Serwer Oracle wyszukuje pierwszą parę WHEN ... THEN, dla której wyraż jest równe wyraż_porównania i zwraca wartość wyraż_powrotu. Jeśli żadna z par WHEN ... THEN nie spełnia tego warunku i jeśli istnieje klauzula else, Oracle zwraca else_expr. W przeciwnym razie Oracle zwraca wartość null. Nie można określić NULL dla wszystkich return_exprs i else_expr.

Wyr i wyr_porównania muszą być tego samego typu danych, którym może być CHAR, VARCHAR2, NCHAR lub NVARCHAR2. Wszystkie zwracane wartości (return_expr) muszą być tego samego typu danych.

W tej składni Oracle porównuje wyrażenie wejściowe (e) z każdym wyrażeniem porównawczym e1, e2, ..., en.

Jeśli wyrażenie wejściowe jest równe dowolnemu wyrażeniu porównania, wyrażenie CASE zwraca odpowiednie wyrażenie wynikowe (r).

Jeśli wyrażenie wejściowe e nie pasuje do żadnego wyrażenia porównania, wyrażenie CASE zwraca wyrażenie w klauzuli ELSE, jeśli klauzula ELSE istnieje, w przeciwnym razie zwraca wartość pustą.

Oracle używa oceny zwarcia dla prostego wyrażenia CASE. Oznacza to, że Oracle ocenia każde wyrażenie porównujące (e1, e2, ..en) tylko przed porównaniem jednego z nich z wyrażeniem wejściowym (e). Oracle nie ocenia wszystkich wyrażeń porównania przed porównaniem któregokolwiek z nich z wyrażeniem (e). W rezultacie Oracle nigdy nie ocenia wyrażenia porównania, jeśli poprzednie jest równe wyrażeniu wejściowemu (e).

Przykład prostego wyrażenia CASE

Do demonstracji użyjemy tabeli produktów.

Poniższe zapytanie używa wyrażenia CASE do obliczenia rabatu dla każdej kategorii produktów, tj. CPU 5%, karta graficzna 10% i inne kategorie produktów 8%

WYBIERZ

ID kategorii CASE

KIEDY 1

THEN ROUND (cena_listy * 0,05,2) - CPU

KIEDY 2

THEN ROUND (Cena katalogowa * 0,1,2) — karta graficzna

INNA RUNDA (cena_listy * 0,08,2) - pozostałe kategorie

KONIEC zniżki

ZAMÓW PRZEZ

Zauważ, że użyliśmy funkcji ROUND(), aby zaokrąglić rabat do dwóch miejsc po przecinku.

Szukane wyrażenie CASE

Wyrażenie CASE przeszukiwane przez Oracle ocenia listę wyrażeń logicznych w celu określenia wyniku.

Przeszukiwana instrukcja CASE ma następującą składnię:

WALIZKA

KIEDY e1TEŻ r1

, COUNT (DISTINCT DepartmentID) [Liczba unikalnych działów], COUNT (DISTINCT PositionID) [Liczba unikalnych pozycji], COUNT (BonusPercent) [Liczba pracowników z premią%], MAX (BonusPercent) [Maksymalny procent premii], MIN ( BonusPercent) [Minimalny procent premii], SUM (Salary / 100 * BonusPercent) [Suma wszystkich premii], AVG (Salary / 100 * BonusPercent) [Średnia premia], AVG (Salary) [Średnia pensja] OD Pracowników

Dla jasności postanowiłem zrobić tu wyjątek i użyłem składni [...] do zdefiniowania aliasów kolumn.

Przyjrzyjmy się, jak powstała każda wartość zwracana, i po pierwsze, przypomnijmy konstrukcje podstawowej składni instrukcji SELECT.

Po pierwsze, ponieważ nie określiliśmy w zapytaniu warunków WHERE, to sumy zostaną obliczone dla szczegółowych danych, które uzyskuje się przez zapytanie:

WYBIERZ * Z Pracownicy

Te. dla wszystkich wierszy tabeli Pracownicy.

Dla jasności wybierzemy tylko pola i wyrażenia używane w funkcjach agregujących:

SELECT DepartmentID, PositionID, BonusPercent, Salary / 100 * BonusPercent, Salary FROM Employees

Identyfikator wydziału	Identyfikator pozycji	Procent bonusu	Wynagrodzenie / 100 * BonusProcent	Wynagrodzenie
1	2	50	2500	5000
3	3	15	225	1500
2	1	ZERO	ZERO	2500
3	4	30	600	2000
3	3	ZERO	ZERO	1500
ZERO	ZERO	ZERO	ZERO	2000

Są to dane początkowe (wiersze szczegółowe), według których zostaną obliczone sumy zagregowanego zapytania.

Przyjrzyjmy się teraz każdej zagregowanej wartości:

LICZBA (*)- od nie określiliśmy warunków filtrowania w klauzuli WHERE w zapytaniu, to COUNT (*) podało nam łączną liczbę rekordów w tabeli, czyli jest to liczba wierszy zwracanych przez zapytanie:

WYBIERZ * Z Pracownicy

COUNT (DISTINCT DepartmentID)- zwrócił nam wartość 3, czyli liczba ta odpowiada liczbie unikalnych wartości działów określonych w kolumnie DepartmentID, z wyłączeniem wartości NULL. Przejrzyjmy wartości kolumny DepartmentID i pokoloruj te same wartości jednym kolorem (swobodnie, wszystkie metody są dobre do treningu):

Odrzucamy NULL, po czym otrzymaliśmy 3 unikalne wartości (1, 2 i 3). Te. wartość otrzymana przez COUNT (DISTINCT DepartmentID), w rozwiniętej formie, może być reprezentowana przez następujący wybór:

SELECT DISTINCT DepartmentID - 2. weź tylko unikalne wartości FROM Employees GDZIE DepartmentID IS NOT NULL - 1. odrzuć wartości NULL

COUNT (DISTINCT ID pozycji)- to samo co zostało powiedziane o COUNT (DISTINCT DepartmentID), tylko pole PositionID. Patrzymy na wartości kolumny PositionID i nie żałujemy kolorów:

LICZBA (procent bonusu)— zwraca liczbę wierszy, które mają wartość BonusPercent, tj. zlicza liczbę rekordów, dla których BonusPercent NIE JEST NULL. Tu będzie nam łatwiej, bo nie ma potrzeby liczenia unikalnych wartości, po prostu odrzuć rekordy z wartościami NULL. Bierzemy wartości z kolumny BonusPercent i wykreślamy wszystkie wartości NULL:

Pozostały 3 wartości. Te. w rozwiniętej formie próbkę można przedstawić w następujący sposób:

WYBIERZ BonusPercent - 2. weź wszystkie wartości OD Pracowników GDZIE BonusPercent NIE JEST NULL - 1. odrzuć wartości NULL

Dlatego Ponieważ nie użyliśmy słów DISTINCT, powtórzone BonusPercent zostanie naliczone, jeśli takie wystąpi, bez uwzględniania BonusPercent równego NULL. Na przykład porównajmy wynik z i bez funkcji DISTINCT. Dla jasności użyjmy wartości pola DepartmentID:

WYBIERZ LICZNIK (*), - 6 LICZBA (DISTINCT ID Działu), - 3 LICZBA (ID Działu) - 5 OD Pracownicy

MAX (procent bonusu)— zwraca maksymalną wartość BonusPercent, ponownie z wyłączeniem wartości NULL.
Bierzemy wartości kolumny BonusPercent i szukamy wśród nich wartości maksymalnej, nie zwracamy uwagi na wartości NULL:

WYBIERZ TOP 1 BonusPercent Z Pracowników GDZIE BonusPercent NIE JEST BRAK ZAMÓWIENIA WEDŁUG BonusPercent DESC - sortuj w porządku malejącym

MIN (procent bonusu)— zwraca minimalną wartość BonusPercent, ponownie z wyłączeniem wartości NULL. Podobnie jak w przypadku MAX, szukamy tylko wartości minimalnej, ignorując NULL:

Te. otrzymujemy następującą wartość:

WYBIERZ TOP 1 BonusPercent OD Pracowników GDZIE BonusPercent NIE JEST BRAK ZEROWY WEDŁUG BonusPercent - sortuj w porządku rosnącym

Wizualna reprezentacja MIN (BonusPercent) i MAX (BonusPercent):

SUMA (Wynagrodzenie / 100 * BonusProcent)- zwraca sumę wszystkich wartości innych niż NULL. Przeanalizuj wartości wyrażenia (Wynagrodzenie / 100 * BonusPercent):

Te. sumują się następujące wartości:

WYBIERZ Wynagrodzenie / 100 * BonusPercent FROM Pracowników GDZIE Wynagrodzenie / 100 * BonusPercent NIE JEST NULL

AVG (Wynagrodzenie / 100 * BonusProcent)- zwraca średnią wartości. Wyrażenia NULL są ignorowane, tj. to pasuje do drugiego wyrażenia:

WYBIERZ AVG (Wynagrodzenie / 100 * Procent Bonusu), - 1108.333333333333 SUM (Wynagrodzenie / 100 * Procent Bonusu) / LICZBA (Wynagrodzenie / 100 * Procent Bonusu), - 1108.333333333333 SUMA (Wynagrodzenie / 100 * Procent Bonusu) / LICZBA (*) - 554.166666666667 FROM Pracownicy

Te. ponownie, wartości NULL nie są brane pod uwagę podczas liczenia ilości.

Jeśli musisz obliczyć średnią dla wszystkich pracowników, jak w trzecim wyrażeniu, które daje 554.166666666667, użyj wstępnej konwersji wartości NULL na zero:

SELECT AVG (ISNULL (Wynagrodzenie / 100 * Procent Bonusu, 0)), - 554.166666666667 SUM (Wynagrodzenie / 100 * Procent Bonusu) / LICZBA (*) - 554.166666666667 FROM Pracownicy

AVG (wynagrodzenie)- w zasadzie wszystko tu jest takie samo jak w poprzednim przypadku, czyli jeśli wynagrodzenie wynosi NULL, nie będzie liczone. Aby odpowiednio uwzględnić wszystkich pracowników, wykonaj wstępną konwersję wartości AVG na NULL (ISNULL (Wynagrodzenie, 0))

Podsumujmy niektóre wyniki:

COUNT (*) - służy do zliczania całkowitej liczby wierszy, które odebrał operator "SELECT...WHERE..."
we wszystkich pozostałych powyższych funkcjach agregujących przy obliczaniu sumy wartości NULL nie są brane pod uwagę
jeśli musimy wziąć pod uwagę wszystkie wiersze, jest to bardziej istotne dla funkcji AVG, wtedy najpierw musimy przetworzyć wartości NULL, na przykład, jak pokazano powyżej „AVG (ISNULL (Wynagrodzenie, 0))”

W związku z tym podczas określania dodatkowego warunku za pomocą funkcji agregujących w klauzuli WHERE zostaną obliczone tylko sumy dla wierszy, które spełniają warunek. Te. kalkulacja wartości agregatów wykonywana jest dla całego zestawu, który uzyskuje się za pomocą konstrukcji SELECT. Na przykład zróbmy to samo, ale tylko w kontekście działu IT:

SELECT COUNT (*) [Łączna liczba pracowników], COUNT (DISTINCT DepartmentID) [Liczba unikalnych działów], COUNT (DISTINCT PositionID) [Liczba unikalnych pozycji], COUNT (BonusProcent) [Liczba pracowników z % premii] , MAX (BonusPercent) [Maksymalny procent bonusu], MIN (BonusPercent) [Minimalny procent bonusu], SUM (Salary / 100 * BonusPercent) [Suma wszystkich bonusów], AVG (Salary / 100 * BonusPercent) [Średnia wielkość bonusu], AVG ( Wynagrodzenie) [Średnia Wynagrodzenie] OD Pracowników GDZIE ID działu = 3 - Weź pod uwagę tylko dział IT

Proponuję, aby dla lepszego zrozumienia działania funkcji agregatowych niezależnie analizować każdą uzyskaną wartość. Wykonujemy tutaj obliczenia, odpowiednio, zgodnie ze szczegółowymi danymi otrzymanymi przez żądanie:

SELECT DepartmentID, PositionID, BonusPercent, Salary / 100 * BonusPercent, Salary FROM Employees WHERE DepartmentID = 3 - uwzględnij tylko dział IT

Identyfikator wydziału	Identyfikator pozycji	Procent bonusu	Wynagrodzenie / 100 * BonusProcent	Wynagrodzenie
3	3	15	225	1500
3	4	30	600	2000
3	3	ZERO	ZERO	1500

Śmiało. Jeżeli funkcja agregująca zwraca NULL (na przykład wszyscy pracownicy nie mają określonej wartości Salary), lub w selekcji nie uwzględniono ani jednego rekordu, a w raporcie w takim przypadku musimy pokazać 0, to Funkcja ISNULL może zawinąć wyrażenie agregujące:

SELECT SUM (Wynagrodzenie), AVG (Wynagrodzenie), - przetwórz sumę za pomocą ISNULL ISNULL (SUM (Wynagrodzenie), 0), ISNULL (AVG (Wynagrodzenie), 0) FROM Employees WHERE DepartmentID = 10 - specjalnie nieistniejący oddział wskazane tutaj, aby zapytanie nie zwracało rekordów

(Brak nazwy kolumny)	(Brak nazwy kolumny)	(Brak nazwy kolumny)	(Brak nazwy kolumny)
ZERO	ZERO	0	0

Uważam, że bardzo ważne jest zrozumienie celu każdej funkcji agregatu i sposobu jej obliczania, ponieważ w SQL jest to główne narzędzie do obliczania sum.

W tym przypadku zbadaliśmy, jak każda funkcja agregująca zachowuje się niezależnie, tj. został zastosowany do wartości całego zestawu rekordów uzyskanych przez polecenie SELECT. Następnie przyjrzymy się, w jaki sposób te same funkcje są używane do obliczania sum grup przy użyciu klauzuli GROUP BY.

GROUP BY - grupowanie danych

Wcześniej obliczyliśmy już sumy dla konkretnego działu, mniej więcej w następujący sposób:

SELECT COUNT (DISTINCT PositionID) PositionCount, COUNT (*) EmplCount, SUM (Salary) SalaryAmount FROM Pracownicy WHERE ID działu = 3 - dane tylko dla działu IT

Teraz wyobraź sobie, że poproszono nas o uzyskanie tych samych liczb w kontekście każdego działu. Oczywiście możemy zakasać rękawy i spełnić tę samą prośbę dla każdego działu. Tak więc, ledwie co powiedziałem, niż zrobiłem, piszemy 4 prośby:

SELECT "Administracja" Info, COUNT (DISTINCT PositionID) PositionCount, COUNT (*) EmplCount, SUM (Salary) SalaryAmount FROM Pracownicy WHERE IDDziału = 1 - dane o Administracji SELECT "Księgowość" Info, COUNT (DISTINCT PositionID) PositionCount, COUNT ( * ) EmplCount, SUM (Salary) SalaryAmount FROM Employees WHERE DepartmentID = 2 - Dane księgowe SELECT "IT" Info, COUNT (DISTINCT PositionID) PositionCount, COUNT (*) EmplCount, SUM (Salary) SalaryAmount FROM Pracownicy WHERE ID działu = 3 - dane o Dział IT SELECT "Inne" Info, COUNT (DISTINCT PositionID) PositionCount, COUNT (*) EmplCount, SUM (Salary) SalaryAmount FROM Employees WHERE DepartmentID IS NULL - i nie zapomnij danych o freelancerach

W rezultacie otrzymujemy 4 zbiory danych:

Należy pamiętać, że możemy używać pól określonych jako stałe - "Administracja", "Księgowość", ...

Ogólnie wydobyliśmy wszystkie liczby, o które nas poproszono, wszystko łączymy w Excelu i przekazujemy dyrektorowi.

Reżyserowi spodobał się raport i mówi: „i dodaj kolejną kolumnę z informacją o średniej pensji”. I jak zawsze trzeba to zrobić bardzo pilnie.

Hmm, co robić?! Ponadto wyobraźmy sobie, że nasze działy to nie 3, ale 15.

To jest dokładnie to, czym jest klauzula GROUP BY w takich przypadkach:

SELECT DepartmentID, COUNT (DISTINCT PositionID) PositionCount, COUNT (*) EmplCount, SUM (Salary) SalaryAmount, AVG (Salary) SalaryAvg - plus spełniamy życzenia dyrektora FROM Employees GROUP BY DepartmentID

Identyfikator wydziału	Liczba pozycji	Liczba zatrudnionych	KwotaWynagrodzenia	Średnia pensja
ZERO	0	1	2000	2000
1	1	1	5000	5000
2	1	1	2500	2500
3	2	3	5000	1666.66666666667

Otrzymaliśmy wszystkie te same dane, ale teraz używamy tylko jednego żądania!

Na razie nie zwracajmy uwagi na to, że nasze działy są wyświetlane w postaci cyferek, wtedy nauczymy się jak pięknie wszystko wyeksponować.

W klauzuli GROUP BY można określić kilka pól „GROUP BY pole1, pole2, ..., poleN”, w tym przypadku grupowanie nastąpi według grup, które tworzą wartości tych pól „pole1, pole2, .. ., poleN".

Na przykład pogrupujmy dane według działów i stanowisk:

WYBIERZ IDDziału, ID stanowiska, LICZBA (*) Liczba pracowników, SUMA (Wynagrodzenie) Kwota wynagrodzenia Z GRUPA PRACOWNIKÓW WEDŁUG IDDziału, ID stanowiska

Następnie wykonywany jest przebieg przez każdą kombinację i wykonywane są obliczenia funkcji agregujących:

WYBIERZ LICZNIK (*) LiczbaPracowników, SUMA (Wynagrodzenie) KwotaWynagrodzenia FROM Pracownicy WHERE IDDziału TO NULL I ID Stanowiska TO NULL WYBIERZ LICZNIK (*) LiczbaZatrudni, SUMA (Wynagrodzenie) KwotaWynagrodzenia FROM Pracownicy WHERE IDDziału = 1 AND IDStanowiska = 2 - ... SELECT COUNT (*) LiczbaPracowników, SUMA (Wynagrodzenie) Kwota Wynagrodzenia OD Pracowników GDZIE IDDziału = 3 ORAZ ID Stanowiska = 4

A potem wszystkie te wyniki są łączone i przekazywane nam jako jeden zestaw:

Z głównego warto zauważyć, że w przypadku grupowania (GROUP BY), na liście kolumn w bloku SELECT:

Możemy używać tylko kolumn wymienionych w klauzuli GROUP BY.
Możesz używać wyrażeń z polami z bloku GROUP BY
Możesz używać stałych, ponieważ nie wpływają na wynik grupowania
Wszystkie inne pola (nie wymienione w bloku GROUP BY) mogą być używane tylko z funkcjami agregacji (COUNT, SUM, MIN, MAX, ...)
Nie trzeba wymieniać wszystkich kolumn z klauzuli GROUP BY na liście kolumn SELECT

I demonstracja wszystkiego, co zostało powiedziane:

SELECT "Stała łańcuchowa" Stała1, - stała w postaci ciągu 1 Stała2, - stała w postaci liczby - wyrażenie wykorzystujące pola należące do grupy CONCAT ("Nr wydziału.", ID-Działu) ConstAndGroupField, CONCAT ("Dział No.", DepartmentID , ", Position No.", PositionID) ConstAndGroupFields, DepartmentID, - pole z listy pól uczestniczących w grupowaniu - PositionID, - pole biorące udział w grupowaniu, nie jest konieczne duplikowanie tutaj COUNT ( *) EmplCount, - liczba wierszy w każdej grupie - pozostałe pola mogą być używane tylko z funkcjami agregacyjnymi: LICZBA, SUMA, MIN, MAX, ... SUM (Wynagrodzenie) KwotaWynagrodzenia, MIN (ID) MinID Z GRUPY Pracowników BY DepartmentID, PositionID - grupowanie według pól DepartmentID, PositionID

Warto również zauważyć, że grupowanie może odbywać się nie tylko według pól, ale także wyrażeń. Na przykład pogrupujmy dane według pracowników, według roku urodzenia:

SELECT CONCAT ("Rok urodzenia -", ROK (Urodziny)) YearOfBirthday, COUNT (*) EmplCount FROM Employees GROUP WEDŁUG ROKU (Urodziny)

Spójrzmy na przykład z bardziej złożonym wyrażeniem. Na przykład weźmy gradację pracowników według roku urodzenia:

WYBIERZ PRZYPADEK WHEN ROK (Urodziny)> = 2000 THEN "od 2000" WHEN ROK (Urodziny)> = 1990 THEN "1999-1990" WHEN ROK (Urodziny)> = 1980 THEN "1989-1980" WHEN ROK (Urodziny)> = 1970 THEN "1979-1970" KIEDY URODZINY NIE JEST NULL THEN "przed 1970" ELSE "nie określono" END RangeName, COUNT (*) EmplCount FROM Pracowników GRUPUJ WEDŁUG PRZYPADKU WHEN ROK (Urodziny)> = 2000 THEN "od 2000" WHEN (Urodziny)> = 1990 TO "1999-1990" KIEDY ROK (Urodziny)> = 1980 TO "1989-1980" KIEDY ROK (Urodziny)> = 1970 TO "1979-1970" KIEDY URODZINY NIE JEST PUNKTOWE TO "przed 1970" ELSE "nie określono" END

Nazwa zakresu	Liczba zatrudnionych
1979-1970	1
1989-1980	2
nie wskazano	2
wcześniej 1970	1

Te. w tym przypadku grupowanie odbywa się według wyrażenia CASE wcześniej obliczonego dla każdego pracownika:

SELECT ID, CASE WEN YEAR (Urodziny)> = 2000 THEN "od 2000" WHEN YEAR (Urodziny)> = 1990 THEN "1999-1990" WHEN YEAR (Urodziny)> = 1980 THEN "1989-1980" WHEN YEAR (Urodziny) > = 1970 THEN "1979-1970" KIEDY URODZINY NIE JEST NULL THEN "przed 1970" ELSE "nie określono" KONIEC OD Pracownicy

I oczywiście możesz łączyć wyrażenia z polami w bloku GROUP BY:

SELECT IDID, CONCAT ("Rok urodzenia -", YEAR (Birthday)) YearOfBirthday, COUNT (*) EmplCount FROM Employees GROUP BY REAR (Birthday), DepartmentID - kolejność może nie pokrywać się z kolejnością ich użycia w SELECT ORDER Blok BY DepartmentID, YearOfBirthday - na koniec możemy zastosować sortowanie do wyniku

Wróćmy do naszego pierwotnego zadania. Jak już wiemy, dyrektorowi ten raport bardzo się spodobał i poprosił nas o robienie tego co tydzień, aby móc monitorować zmiany w firmie. Aby za każdym razem w Excelu nie przerywać wartości liczbowej działu po jego nazwie, wykorzystamy wiedzę, którą już posiadamy i udoskonalimy nasze zapytanie:

WYBIERZ PRZYPADEK ID działu WHEN 1 THEN "Administracja" WHEN 2 THEN "Księgowość" WHEN 3 THEN "IT" ELSE "Inne" KONIEC Info, COUNT (DISTINCT PositionID) PositionCount, COUNT (*) EmplCount, SUM (Salary) SalaryAmount, AVG (Salary ) SalaryAvg - plus spełniamy życzenia dyrektora OD PRACOWNIKÓW GRUPA WEDŁUG IDDZIAŁÓW ZAMÓW WG Info - dla większej wygody dodaj sortowanie po kolumnie Info

Chociaż z zewnątrz może wyglądać przerażająco, nadal jest lepszy niż pierwotnie. Wadą jest to, że jeśli zostanie uruchomiony nowy dział i jego pracownicy, to będziemy musieli dodać wyrażenie CASE, aby pracownicy nowego działu nie dostali się do grupy „Inni”.

Ale nic, z czasem nauczymy się robić wszystko pięknie, aby nasza próbka nie zależała od pojawiania się nowych danych w bazie, ale była dynamiczna. Pobiegnę trochę naprzód, aby pokazać, z jakimi prośbami staramy się wystąpić:

SELECT ISNULL (nazwa oddziału, "Inne") Nazwa oddziału, COUNT (DISTINCT emp.PositionID) PositionCount, COUNT (*) EmplCount, SUM (prac.Salary) SalaryAmount, AVG (prac.Salary) SalaryAvg - plus spełnij życzenia dyrektor FROM Pracownicy emp LEWY DOŁĄCZ Działy dział ON mp.IDOddziału = IDOddziału GROUP BY prac.IDOddziału, NazwaOddziału ORDER BY NazwaOddziału

Ogólnie rzecz biorąc, nie martw się – wszyscy zaczynali od prostych. Na razie wystarczy zrozumieć istotę klauzuli GROUP BY.

Na koniec zobaczmy, jak można tworzyć raporty podsumowujące za pomocą funkcji GROUP BY.

Na przykład wyświetlmy tabelę przestawną, w kontekście działów, aby obliczyć łączne wynagrodzenie otrzymywane przez pracowników według stanowiska:

SELECT IDDziału, SUM (CASE WHEN IDPozycji = 1 THEN Wynagrodzenie END) [Księgowi], SUM (CASE WHEN IDPozycji = 2 THEN Wynagrodzenie END) [Dyrektorzy], SUMA (CASE WEN IDPozycji = 3 THEN Wynagrodzenie END) [Programiści], SUMA ( PRZYPADEK GDY ID stanowiska = 4 THEN Wynagrodzenie KONIEC) [Senior Programiści], SUMA (Wynagrodzenie) [Ogółem Działu] Z GRUPA PRACOWNIKÓW WEDŁUG ID działu

Te. możemy dowolnie używać dowolnych wyrażeń wewnątrz funkcji agregujących.

Możesz oczywiście zostać przepisany za pomocą IIF:

SELECT IDDziału, SUM (IIF (Identyfikator Stanowiska = 1, Wynagrodzenie, NULL)) [Księgowy], SUM (IIF (Identyfikator Stanowiska = 2, Wynagrodzenie, NULL)) [Dyrektorzy], SUM (IIF (Identyfikator Stanowiska = 3, Wynagrodzenie, NULL)) [Programiści], SUM (IIF (PositionID = 4, Wynagrodzenie, NULL)) [Senior Programiści], SUM (Wynagrodzenie) [Ogółem Działu] OD Pracowników GRUPA WEDŁUG ID działu

Ale w przypadku IIF będziemy musieli jawnie określić NULL, który zostanie zwrócony, jeśli warunek nie zostanie spełniony.

W podobnych przypadkach wolę używać CASE bez bloku ELSE niż ponownie pisać NULL. Ale to z pewnością kwestia gustu, o którą się nie dyskutuje.

A pamiętajmy, że w funkcjach agregujących nie są brane pod uwagę wartości NULL.

W celu konsolidacji dokonaj niezależnej analizy danych uzyskanych w ramach rozszerzonego żądania:

SELECT IDDziału, CASE WEN IDPozycji = 1 THEN Wynagrodzenie END [Księgowy], CASE WEN IDPozycji = 2 THEN Wynagrodzenie END [Dyrektorzy], CASE WEN IDPozycji = 3 THEN Wynagrodzenie END [Programiści], CASE WEN IDPozycji = 4 THEN Wynagrodzenie END [Senior Programiści] ], Wynagrodzenie [Dział Razem] OD Pracownicy

Identyfikator wydziału	Księgowy	Dyrektorzy	Programiści	Starsi programiści	Razem według działu
1	ZERO	5000	ZERO	ZERO	5000
3	ZERO	ZERO	1500	ZERO	1500
2	2500	ZERO	ZERO	ZERO	2500
3	ZERO	ZERO	ZERO	2000	2000
3	ZERO	ZERO	1500	ZERO	1500
ZERO	ZERO	ZERO	ZERO	ZERO	2000

Pamiętajmy też, że jeśli zamiast NULL chcemy widzieć zera, to możemy przetworzyć wartość zwracaną przez funkcję agregującą. Na przykład:

SELECT ID działu, ISNULL (SUM (IIF (Identyfikator stanowiska = 1, Wynagrodzenie, NULL)), 0) [Księgowy], ISNULL (SUM (IIF (Identyfikator stanowiska = 2, Wynagrodzenie, NULL)), 0) [Dyrektorzy], ISNULL (SUM (IIF (PositionID = 3, Wynagrodzenie, NULL)), 0) [Programiści], ISNULL (SUM (IIF (PositionID = 4, Wynagrodzenie, NULL)), 0) [Starsi Programiści], ISNULL (SUM (Wynagrodzenie), 0 ) [Ogółem działu] Z GRUPA PRACOWNIKÓW WEDŁUG ID działu

Teraz, w celach ćwiczeniowych, możesz:

wyświetlaj nazwy oddziałów zamiast ich identyfikatorów, np. dodając wyrażenie CASE przetwarzające DepartmentID w bloku SELECT
dodaj sortowanie według nazwy działu za pomocą ORDER BY

GROUP BY w rzadkim z funkcjami agregacyjnymi, jednym z głównych narzędzi służących do pozyskiwania danych sumarycznych z bazy danych, ponieważ zwykle dane są używane w tej formie, ponieważ zwykle jesteśmy zobowiązani do dostarczania raportów podsumowujących, a nie szczegółowych danych (arkuszy). I oczywiście wszystko kręci się wokół znajomości podstawowego projektu, ponieważ zanim coś streścisz (zagregujesz), najpierw musisz to poprawnie zaznaczyć za pomocą "SELECT ... WHERE ...".

Praktyka odgrywa tutaj ważną rolę, dlatego jeśli wyznaczysz sobie cel, aby zrozumieć język SQL, a nie uczyć się, ale rozumieć - ćwicz, ćwicz i ćwicz, przechodząc przez najróżniejsze opcje, jakie możesz wymyślić.

Na początkowym etapie, jeśli nie masz pewności co do poprawności uzyskanych zagregowanych danych, wykonaj próbkę szczegółową, zawierającą wszystkie wartości, dla których agregacja się odbywa. I sprawdź poprawność obliczeń ręcznie, korzystając z tych szczegółowych danych. W takim przypadku użycie Excela może być bardzo pomocne.

Powiedzmy, że dotarłeś do tego punktu

Załóżmy, że jesteś księgowym S. S. Sidorovem, który postanowił nauczyć się pisać zapytania SELECT.
Załóżmy, że skończyłeś już czytać ten samouczek do tego momentu i jesteś już pewny używania wszystkich powyższych podstawowych konstrukcji, tj. możesz:

Wybierz szczegółowe dane według klauzuli WHERE z jednej tabeli
Dowiedz się, jak korzystać z funkcji agregujących i grupowania z jednej tabeli

Ponieważ w pracy myśleli, że już wszystko umiesz, dostałeś dostęp do bazy danych (a czasem tak się dzieje), a teraz opracowałeś i wyciągasz ten bardzo tygodniowy raport dla dyrektora.

Tak, ale nie wzięli pod uwagę, że nie można jeszcze budować zapytań z kilku tabel, a tylko z jednej, tj. nie wiesz jak zrobić coś takiego:

WYBIERZ PRACĘ *, - zwróć wszystkie pola tabeli Pracownicy dział Nazwa NazwaDziału, - dodaj pole Nazwisko z tabeli Działy poz.Nazwa NazwaStanowiska do tych pól - a także dodaj pole Nazwisko z tabeli Stanowiska FROM Pracodawca LEWY DOŁĄCZ Działy dep ON emp.DepartmentID = dep.ID LEFT JOIN Pozycje poz ON emp.PositionID = poz.ID

Pomimo tego, że nie wiesz, jak to zrobić, uwierz mi, dobrze zrobiłeś, a już tak wiele osiągnąłeś.

Jak więc wykorzystać swoją obecną wiedzę i uzyskać jeszcze bardziej produktywne wyniki?! Wykorzystamy moc kolektywnego umysłu – idziemy do programistów, którzy dla Ciebie pracują, tj. do Andreeva A.A., Petrova P.P. lub Nikolayev N.N. i poproś jednego z nich o napisanie dla Ciebie widoku (WIDOK lub po prostu „Widok”, dzięki czemu nawet szybciej Cię zrozumieją), który oprócz głównych pól z tabeli Pracownicy zwróci również pola z „Nazwa wydziału” i „Nazwa stanowiska”, których tak bardzo brakuje ci w tygodniowym raporcie, który przesłał ci Iwanow II.

Dlatego wszystko dobrze wyjaśniłeś, to informatycy od razu zrozumieli, czego od nich chcą i stworzyli specjalnie dla Ciebie widok o nazwie ViewEmployeesInfo.

Oświadczamy, że nie widzisz następnego polecenia, ponieważ Specjaliści IT to robią:

CREATE VIEW ViewEmployeesInfo AS SELECT Emp.prac.*, - zwróć wszystkie pola tabeli Employees dep.Name DepartmentName, - dodaj do tych pól pole Name z tabeli Departments Pos.Name PositionName - a także dodaj pole Name z tabeli Positions FROM Pracownicy emp LEFT JOIN Działy dz.pracy.Działu = ID oddziału LEFT JOIN Pozycje poz ON emp.PositionID = poz.ID

Te. dla Ciebie to wszystko, choć przerażające i niezrozumiałe, tekst pozostaje poza ekranem, a informatycy podają Ci tylko nazwę widoku „ViewEmployeesInfo”, który zwraca wszystkie powyższe dane (czyli to, o co ich prosiłeś).

Możesz teraz pracować z tym widokiem jak ze zwykłą tabelą:

WYBIERZ * Z ZobaczInformacje o pracownikach

Dlatego teraz wszystkie dane potrzebne do raportu znajdują się w jednej „tabeli” (a la view), wtedy możesz łatwo przerobić raport tygodniowy:

SELECT NazwaWydziału, COUNT (DISTINCT ID stanowiska) Liczba stanowisk, LICZBA (*) Liczba pracowników, SUMA (Wynagrodzenie) Kwota wynagrodzenia, ŚREDNIE (Wynagrodzenie) Śr.wynagrodzenie FROM ViewEmployeesInfo emp GROUP BY IDDziału, Nazwa działu ORDER BY NazwaWydziału

Teraz wszystkie nazwy działów są w terenie, dodatkowo żądanie stało się dynamiczne i zmieni się po dodaniu nowych działów i ich pracowników, tj. Teraz nie musisz nic powtarzać, ale wystarczy wykonać prośbę raz w tygodniu i przekazać jej wynik dyrektorowi.

Te. dla ciebie w tym przypadku, jakby nic się nie zmieniło, kontynuujesz pracę z jedną tabelą (ale bardziej poprawne byłoby z widokiem ViewEmployeesInfo), która zwraca wszystkie potrzebne dane. Dzięki pomocy informatyków szczegóły wydobycia DepartmentName i PositionName pozostają dla Ciebie w czarnej skrzynce. Te. widok wygląda tak samo jak zwykła tabela, uważaj to za rozszerzoną wersję tabeli Pracownicy.

Na przykład stwórzmy oświadczenie, aby upewnić się, że wszystko jest naprawdę tak, jak powiedziałem (że cała próbka pochodzi z jednego widoku):

WYBIERZ ID, Imię, Wynagrodzenie FROM ViewEmployeesInfo GDZIE Wynagrodzenie NIE JEST NULL I Wynagrodzenie> 0 ORDER BY Nazwa

Mam nadzieję, że ta prośba jest dla ciebie jasna.

Wykorzystanie widoków w niektórych przypadkach pozwala znacznie poszerzyć granice użytkowników, którzy potrafią pisać podstawowe zapytania SELECT. W tym przypadku widok jest płaską tabelą ze wszystkimi danymi, których potrzebuje użytkownik (dla tych, którzy rozumieją OLAP, można to porównać do przybliżenia kostki OLAP z faktami i wymiarami).

Wycinek z Wikipedii. Chociaż SQL został pomyślany jako narzędzie dla użytkownika końcowego, w końcu stał się tak złożony, że stał się narzędziem programisty.

Jak widzicie, drodzy użytkownicy, język SQL został pierwotnie pomyślany jako narzędzie dla Was. Więc wszystko jest w twoich rękach i pragnieniu, nie odpuszczaj.

POSIADAJĄCY - nałożenie warunku selekcji na zgrupowane dane

Właściwie, jeśli rozumiesz, czym jest grupowanie, to nie ma nic skomplikowanego w MIEĆ. HAVING jest nieco podobny do WHERE, tylko jeśli warunek WHERE jest stosowany do danych szczegółowych, to warunek HAVING jest stosowany do już zgrupowanych danych. Z tego powodu w warunkach bloku HAVING możemy użyć albo wyrażeń z polami zawartymi w grupowaniu, albo wyrażeń zawartych w funkcjach agregujących.

Rozważmy przykład:

WYBIERZ IDDziału, SUMA (Wynagrodzenie) Wynagrodzenie Kwota Z Pracowników GRUPA WEDŁUG IDDziału POSIADAJĄC SUMA (Wynagrodzenie)> 3000

Identyfikator wydziału	KwotaWynagrodzenia
1	5000
3	5000

Te. Ta prośba zwróciła nam zgrupowane dane tylko dla tych działów, dla których łączne wynagrodzenie wszystkich pracowników przekracza 3000, tj. "SUMA (Wynagrodzenie)> 3000".

Te. tutaj przede wszystkim odbywa się grupowanie i obliczane są dane dla wszystkich działów:

SELECT ID Działu, SUMA (Wynagrodzenie) Kwota Wynagrodzenia Z Pracowników GRUPA WEDŁUG ID Działu - 1. uzyskaj pogrupowane dane dla wszystkich działów

I już warunek określony w bloku HAVING jest stosowany do tych danych:

SELECT ID działu, SUMA (Wynagrodzenie) Kwota wynagrodzenia FROM Pracownicy GRUPA WEDŁUG ID działu - 1. uzyskaj zgrupowane dane dla wszystkich działów POSIADAJĄC SUMA (Wynagrodzenie)> 3000 - 2.warunek filtrowania zgrupowanych danych

W warunku HAVING możesz również budować złożone warunki za pomocą operatorów AND, OR i NOT:

WYBIERZ ID działu, SUMA (Wynagrodzenie) Kwota wynagrodzenia Z GRUPA PRACOWNIKÓW WEDŁUG ID działu POSIADAJĄC SUMA (Wynagrodzenie)> 3000 I LICZBA (*)<2 -- и число людей меньше 2-х

Jak widać tutaj funkcja agregująca (patrz "LICZBA (*)") może być określona tylko w bloku HAVING.

W związku z tym możemy wyświetlić tylko numer działu, który spełnia warunek HAVING:

WYBIERZ ID działu Z GRUPY PRACOWNIKÓW WEDŁUG ID działu POSIADAJĄC SUMA (Wynagrodzenie)> 3000 I LICZBA (*)<2 -- и число людей меньше 2-х

Przykład użycia warunku HAVING na polu zawartym w grupie GROUP BY:

SELECT IDDziału, SUMA (Wynagrodzenie) Kwota Wynagrodzenia FROM Pracownicy GRUPA WEDŁUG IDDziału - 1. utwórz grupowanie POSIADAJĄC IDDziału = 3 - 2. przefiltruj wynik grupowania

To tylko przykład, ponieważ w takim przypadku bardziej logiczne byłoby sprawdzenie warunku WHERE:

SELECT IDDziału, SUMA (Wynagrodzenie) Kwota Wynagrodzenia FROM Pracownicy WHERE IDDziału = 3 - 1. filtruj szczegółowe dane GROUP BY IDDziału - 2. dokonaj grupowania tylko według wybranych rekordów

Te. najpierw przefiltruj pracowników według działu 3, a dopiero potem dokonaj obliczeń.

Uwaga. W rzeczywistości, nawet jeśli te dwa zapytania wyglądają inaczej, optymalizator DBMS może je wykonać w ten sam sposób.

Myślę, że na tym kończy się opowieść o warunkach POSIADAJĄCYCH.

Podsumujmy

Podsumujmy dane uzyskane w drugiej i trzeciej części i rozważmy konkretną lokalizację każdej badanej konstrukcji i wskażmy kolejność ich realizacji:

Budowa / Blok	Zlecenie realizacji	Wykonywana funkcja
WYBIERZ wyrażenia zwrotne	4	Zwrot danych otrzymanych na żądanie
OD źródła	0	W naszym przypadku są to do tej pory wszystkie wiersze tabeli.
WHERE warunek wyboru źródła	1	Wybierane są tylko wiersze spełniające warunek
GROUP BY grupowanie wyrażeń	2	Tworzy grupy według określonego wyrażenia grupującego. Obliczanie wartości zagregowanych dla tych grup wykorzystywanych w blokach SELECT lub HAVING
POSIADAJĄC filtr na zgrupowanych danych	3	Filtrowanie zastosowane do zgrupowanych danych
wyrażenie ORDER BY do sortowania wyniku	5	Sortowanie danych według określonego wyrażenia

Oczywiście możesz również zastosować klauzule DISTINCT i TOP, których nauczyłeś się w części drugiej, do zgrupowanych danych.

Poniższe sugestie w tym przypadku dotyczą wyniku końcowego:

WYBIERZ TOP 1 - 6. zastosuje ostatnią SUMA (Wynagrodzenie) WynagrodzenieKwota Z Pracowników GRUPA WEDŁUG IDDziału POSIADAJĄC SUMA (Wynagrodzenie)> 3000 ZAMÓWIENIE WG IDDziału - 5.sortuj wynik

Przeanalizuj sam, w jaki sposób uzyskano te wyniki.

Wniosek

Głównym celem, który postawiłem w tej części, jest odkrycie dla Ciebie istoty funkcji agregujących i grupowań.

Jeśli podstawowy projekt pozwolił nam uzyskać niezbędne dane szczegółowe, to zastosowanie funkcji agregujących i grupowań do tych szczegółowych danych dało nam możliwość uzyskania na ich temat danych zbiorczych. Tak więc, jak widać, wszystko jest tutaj ważne, tk. jedno oparte jest na drugim – bez znajomości podstawowej struktury nie będziemy w stanie np. poprawnie dobrać danych, dla których musimy obliczyć sumy.

Tutaj celowo staram się pokazać tylko podstawy, aby skupić uwagę początkującego na najważniejszych strukturach i nie przeciążać ich niepotrzebnymi informacjami. Dobre zrozumienie podstawowych struktur (o których będę mówił w kolejnych częściach) da Ci możliwość rozwiązania niemal każdego problemu pobierania danych z RDB. Podstawowe konstrukcje instrukcji SELECT mają zastosowanie w tej samej formie w prawie wszystkich SZBD (różnice tkwią głównie w szczegółach, na przykład w implementacji funkcji - do pracy z ciągami, czasem itp.).

Z kolei solidna znajomość bazy da Ci możliwość łatwego samodzielnego poznania różnych rozszerzeń języka SQL, takich jak:

GRUPUJ WEDŁUG ROLLUP (…), GRUP WEDŁUG ZESTAWÓW GRUPOWANIA (…),…
PIVOT, UNPIVOT
itp.

Na potrzeby tego samouczka postanowiłem nie mówić o tych rozszerzeniach, ponieważ a bez ich wiedzy, znając tylko podstawowe konstrukcje języka SQL, można rozwiązać bardzo szeroki wachlarz problemów. Rozszerzenia języka SQL służą w rzeczywistości do rozwiązywania pewnego zakresu zadań, tj. pozwalają z wdziękiem rozwiązać problem określonej klasy (ale nie zawsze efektywniej pod względem szybkości czy zużywanych zasobów).

Jeśli stawiasz pierwsze kroki w SQL, najpierw skup się na nauce podstawowych konstrukcji. posiadając bazę, wszystko inne będzie ci znacznie łatwiej zrozumieć, a poza tym na własną rękę. Przede wszystkim musisz dogłębnie zrozumieć możliwości języka SQL, tj. jaki rodzaj operacji generalnie umożliwia wykonanie na danych. Przekazywanie informacji początkującym w obszernej formie to kolejny z powodów, dla których pokażę tylko najważniejsze (żelazne) konstrukcje.

Powodzenia w nauce i zrozumieniu języka SQL.

Część czwarta -

Część pierwsza - habrahabr.ru/post/255361
Część druga - habrahabr.ru/post/255523

O czym będzie mowa w tej części

W tej części poznamy:

z wyrażeniem CASE, które umożliwia uwzględnienie w zapytaniu wyrażeń warunkowych;
z funkcjami agregacyjnymi, które pozwalają uzyskać wszelkiego rodzaju sumy (wartości agregowane) obliczane na podstawie szczegółowych danych uzyskanych przez operator "SELECT...WHERE...";
z klauzulą GROUP BY, która pomimo funkcji agregujących pozwala uzyskać sumy dla danych szczegółowych w kontekście grup;
z klauzulą HAVING, która umożliwia filtrowanie po zgrupowanych danych.

Wyrażenie CASE - instrukcja warunkowa SQL

Ten operator umożliwia sprawdzenie warunków i zwrócenie jednego lub drugiego wyniku, w zależności od spełnienia określonego warunku.

Oświadczenie CASE ma 2 formy:

Wyrażenia mogą być również używane jako znaczenia.

Weźmy przykład pierwszego formularza CASE:

SELECT ID, Imię, Wynagrodzenie, CASE WHEN Wynagrodzenie>=3000 THEN "RFP>=3000" WHEN Wynagrodzenie>=2000 THEN "2000<= ЗП < 3000" ELSE "ЗП < 2000" END SalaryTypeWithELSE, CASE WHEN Salary>= 3000 TO "wynagrodzenie>=3000" KIEDY wynagrodzenie>=2000 TO "2000<= ЗП < 3000" END SalaryTypeWithoutELSE FROM Employees

KIEDY warunki są testowane sekwencyjnie od góry do dołu. Po osiągnięciu pierwszego spełniającego warunku dalsze sprawdzanie jest przerywane i zwracana jest wartość określona po słowie THEN dla tej klauzuli WHEN.

Jeśli żaden z warunków WHEN nie jest spełniony, zwracana jest wartość określona po słowie ELSE (co w tym przypadku oznacza "ELSE RETURN...").

Jeśli nie określono bloku ELSE i nie są spełnione żadne warunki WHEN, zwracana jest wartość NULL.

Zarówno w pierwszej, jak i drugiej formie blok ELSE znajduje się na samym końcu struktury CASE, tj. po wszystkich warunkach KIEDY.

Weźmy przykład drugiego formularza CASE:

Załóżmy, że na nowy rok postanowili nagrodzić wszystkich pracowników i poprosili o obliczenie wysokości premii zgodnie z następującym schematem:

Pracownikom działu IT do wydania 15% wynagrodzenia;
Pracownicy Działu Księgowości 10% wynagrodzenia;
Cała reszta 5% wynagrodzenia.

Do tego zadania używamy zapytania z wyrażeniem CASE:

SELECT ID, Name, Salary, DepartmentID, - dla jasności wyświetlamy procent jako linię CASE DepartmentID - zaznaczona wartość WHEN 2 THEN "10%" - 10% pensji do wydania Księgowym WHEN 3 THEN "15%" - 15% od pensji do przekazania pracownikom IT JESZCZE "5%" - wszystkim innym 5% KONIEC NowyRokBonusProcent, - zbudujmy wyrażenie używając CASE aby zobaczyć wysokość premii Wynagrodzenie / 100 * CASE DepartmentID WHEN 2 THEN 10 - 10% wynagrodzenia do wydania Dla księgowych KIEDY 3 TO 15 - 15% wynagrodzenia do wydania Pracownicy IT JESZCZE 5 - wszyscy pozostali po 5% KONIEC Kwota Premia OD Pracowników

Wykonuje to sekwencyjne sprawdzanie wartości DepartmentID względem wartości WHEN. Gdy pierwszy DepartmentID jest równy wartości WHEN, sprawdzanie jest przerywane i zwracana jest wartość określona po słowie THEN dla tej klauzuli WHEN.

W związku z tym zwracana jest wartość bloku ELSE, jeśli DepartmentID nie pasuje do żadnej wartości WHEN.

Jeśli nie ma bloku ELSE, zostanie zwrócone NULL, jeśli DepartmentID nie pasuje do żadnej wartości WHEN.

Drugi formularz CASE jest łatwy do przedstawienia za pomocą pierwszego formularza:

SELECT ID, Name, Salary, DepartmentID, CASE WEN DepartmentID = 2 THEN "10%" - 10% pensji wydawanej dla Księgowych WHEN DepartmentID = 3 THEN "15%" - 15% pensji wydawanej do IT pracownicy INNY "5%" - wszyscy inni 5% KONIEC NowyRokBonusProcent, - zbuduj wyrażenie używając CASE, aby zobaczyć kwotę premii Wynagrodzenie / 100 * CASE WEN DepartmentID = 2 THEN 10 - 10% wynagrodzenia do wydania Księgowym WHEN DepartmentID = 3 NASTĘPNIE 15 - 15% wynagrodzenia dla pracowników IT JESZCZE 5 - wszyscy inni po 5% KONIEC Kwota Premia OD Pracowników

Tak więc druga forma jest po prostu uproszczoną notacją dla tych przypadków, w których musimy wykonać porównanie równości tej samej wartości testowej z każdą wartością / wyrażeniem WHEN.

Uwaga. Pierwsza i druga forma CASE są zawarte w standardzie języka SQL, więc najprawdopodobniej powinny mieć zastosowanie w wielu DBMS.

W wersji MS SQL 2012 pojawił się uproszczony formularz notacji IIF. Może służyć do uproszczenia instrukcji CASE, gdy zwracane są tylko 2 wartości. Projekt IIF wygląda następująco:

IIF (warunek, prawdziwa_wartość, fałszywa_wartość)

Te. w rzeczywistości jest to opakowanie dla następującej konstrukcji CASE:

CASE WHEN warunek THEN prawda_wartość ELSE fałsz_wartość END

Zobaczmy przykład:

SELECT ID, Imię, Wynagrodzenie, IIF (Wynagrodzenie> = 2500, "Wynagrodzenie> = 2500", "Wynagrodzenie< 2500") DemoIIF, CASE WHEN Salary>= 2500 TO "RFP> = 2500" ELSE "RFP< 2500" END DemoCASE FROM Employees

Konstrukcje CASE, IIF mogą być zagnieżdżone w sobie. Rozważmy abstrakcyjny przykład:

SELECT ID, Name, Salary, CASE WHEN DepartmentID IN (1,2) THEN "A" WHEN DepartmentID = 3 THEN CASE PositionID - zagnieżdżony CASE WHEN 3 THEN "B-1" WHEN 4 THEN "B-2" END ELSE " C "KONIEC Demo1, IIF (IDWydziału IN (1,2)," A ", IIF (IDWydziału = 3, PRZYPADEK PozycjaID WHEN 3 THEN" B-1 "WHEN 4 THEN" B-2 "KONIEC," C ")) Demo2 OD pracowników

Ponieważ konstrukcje CASE i IIF są wyrażeniami zwracającymi wynik, możemy ich używać nie tylko w bloku SELECT, ale także w innych blokach, które pozwalają na użycie wyrażeń, na przykład w klauzulach WHERE lub ORDER BY.

Na przykład otrzymamy zadanie stworzenia listy rozdania pensji w następujący sposób:

Przede wszystkim pensje powinni otrzymywać pracownicy, których wynagrodzenie jest mniejsze niż 2500
Ci pracownicy, którzy mają wynagrodzenie wyższe lub równe 2500, otrzymują wynagrodzenie na drugim miejscu
W ramach tych dwóch grup musisz posortować wiersze według pełnej nazwy (pole Nazwa)

Spróbujmy rozwiązać ten problem, dodając wyrażenie CASE do bloku ORDER BY:

WYBIERZ ID, Nazwisko, Wynagrodzenie FROM Pracownicy ORDER BY CASE KIEDY Wynagrodzenie> = 2500 TO 1 ELSE 0 KONIEC, - najpierw wystaw pensję tym, którzy mają ją poniżej 2500 Nazwisko - dalej sortuj listę według imienia i nazwiska

Jak widać, Iwanow i Sidorow wyjdą z pracy jako ostatni.

I abstrakcyjny przykład użycia CASE w klauzuli WHERE:

SELECT ID, Imię, Wynagrodzenie FROM Pracownicy WHERE CASE WHEN Wynagrodzenie> = 2500 THEN 1 ELSE 0 END = 1 - wszystkie rekordy, których wyrażenie wynosi 1

Możesz spróbować samodzielnie powtórzyć 2 ostatnie przykłady za pomocą funkcji IIF.

I na koniec jeszcze raz pamiętajmy o wartościach NULL:

SELECT ID, Name, Salary, DepartmentID, CASE WEN DepartmentID = 2 THEN "10%" - 10% wynagrodzenia do wydania Księgowym WHEN DepartmentID = 3 THEN "15%" - do wydania 15% pensji pracownikom IT WHEN DepartmentID IS NULL THEN "-" - freelancerom nie dajemy bonusów (używamy IS NULL) ELSE "5%" - wszyscy inni mają po 5% END NewYearBonusPercent1, - ale nie możesz sprawdzić NULL, pamiętaj, co zostało powiedziane o NULL w drugiej części CASE DepartmentID - - wartość sprawdzona KIEDY 2 TO "10%" KIEDY 3 TO "15%" KIEDY NULL TO "-" - !!! w tym przypadku użycie drugiego formularza CASE nie jest odpowiednie ELSE "5%" KONIEC NowyRokBonusProcent2 OD Pracowników

Oczywiście możesz przepisać coś takiego:

SELECT ID, Name, Salary, DepartmentID, CASE ISNULL (DepartmentID, -1) - użyj zamiennika w przypadku NULL przez -1 WHEN 2 THEN "10%" WHEN 3 THEN "15%" WHEN -1 THEN "-" - jeśli mamy pewność, że nie ma działu o ID równym (-1) i nie będzie INNE "5%" KONIEC NowyRokBonusProcent3 OD Pracowników

Ogólnie lot wyobraźni w tym przypadku nie jest ograniczony.

Na przykład zobaczmy, jak można modelować funkcję ISNULL za pomocą CASE i IIF:

SELECT ID, Imię, Nazwisko, ISNULL (Nazwisko, "Nieokreślone") DemoISNULL, CASE WEN Nazwisko JEST NULL THEN "Nieokreślone" ELSE Nazwisko END DemoCASE, IIF (Nazwisko JEST NULL, "Nieokreślone", Nazwisko) DemoIIF FROM Pracownicy

Konstrukcja CASE to bardzo potężna funkcja SQL, która pozwala narzucić dodatkową logikę obliczania wartości zbioru wyników. W tej części posiadanie konstrukcji CASE będzie nam nadal przydatne, dlatego w tej części przede wszystkim zwracamy na to uwagę.

Funkcje agregujące

Tutaj omówimy tylko podstawowe i najczęściej używane funkcje agregujące:

Nazwa	Opis
LICZBA (*)	Zwraca liczbę wierszy odebranych przez operator "SELECT ... WHERE ...". W przypadku braku WHERE, liczba wszystkich rekordów w tabeli.
LICZBA (kolumna / wyrażenie)	Zwraca liczbę wartości innych niż NULL w określonej kolumnie/wyrażeniu
COUNT (kolumna/wyrażenie DISTINCT)	Zwraca liczbę unikalnych wartości innych niż NULL w określonej kolumnie/wyrażeniu
SUMA (kolumna / wyrażenie)	Zwraca sumę nad wartościami kolumny/wyrażenia
AVG (kolumna / wyrażenie)	Zwraca średnią z wartości kolumny/wyrażenia. Wartości NULL nie są liczone do liczenia.
MIN (kolumna / wyrażenie)	Zwraca minimalną wartość nad wartościami kolumny/wyrażenia
MAX (kolumna / wyrażenie)	Zwraca maksymalną wartość nad wartościami kolumny/wyrażenia

Funkcje agregujące pozwalają nam obliczyć całkowitą wartość dla zbioru wierszy uzyskanych za pomocą instrukcji SELECT.

Spójrzmy na każdą funkcję na przykładzie:

SELECT COUNT (*) [Łączna liczba pracowników], COUNT (DISTINCT DepartmentID) [Liczba unikalnych działów], COUNT (DISTINCT PositionID) [Liczba unikalnych pozycji], COUNT (BonusProcent) [Liczba pracowników z % premii] , MAX (BonusPercent) [Maksymalny procent bonusu], MIN (BonusPercent) [Minimalny procent bonusu], SUM (Salary / 100 * BonusPercent) [Suma wszystkich bonusów], AVG (Salary / 100 * BonusPercent) [Średnia wielkość bonusu], AVG ( Wynagrodzenie) [Średnia pensja] OD Pracowników

Dla jasności postanowiłem zrobić tu wyjątek i użyłem składni [...] do zdefiniowania aliasów kolumn.

Przyjrzyjmy się, jak powstała każda wartość zwracana, i po pierwsze, przypomnijmy konstrukcje podstawowej składni instrukcji SELECT.

Po pierwsze, ponieważ nie określiliśmy w zapytaniu warunków WHERE, to sumy zostaną obliczone dla szczegółowych danych, które uzyskuje się przez zapytanie:

WYBIERZ * Z Pracownicy

Te. dla wszystkich wierszy tabeli Pracownicy.

Dla jasności wybierzemy tylko pola i wyrażenia używane w funkcjach agregujących:

SELECT DepartmentID, PositionID, BonusPercent, Salary / 100 * BonusPercent, Salary FROM Employees

Identyfikator wydziału	Identyfikator pozycji	Procent bonusu	Wynagrodzenie / 100 * BonusProcent	Wynagrodzenie
1	2	50	2500	5000
3	3	15	225	1500
2	1	ZERO	ZERO	2500
3	4	30	600	2000
3	3	ZERO	ZERO	1500
ZERO	ZERO	ZERO	ZERO	2000

Są to dane początkowe (wiersze szczegółowe), według których zostaną obliczone sumy zagregowanego zapytania.

Przyjrzyjmy się teraz każdej zagregowanej wartości:

WYBIERZ * Z Pracownicy

SELECT DISTINCT DepartmentID - 2. weź tylko unikalne wartości FROM Employees GDZIE DepartmentID IS NOT NULL - 1. odrzuć wartości NULL

COUNT (DISTINCT ID pozycji)- to samo co zostało powiedziane o COUNT (DISTINCT DepartmentID), tylko pole PositionID. Patrzymy na wartości kolumny PositionID i nie żałujemy kolorów:

Pozostały 3 wartości. Te. w rozwiniętej formie próbkę można przedstawić w następujący sposób:

WYBIERZ BonusPercent - 2. weź wszystkie wartości OD Pracowników GDZIE BonusPercent NIE JEST NULL - 1. odrzuć wartości NULL

WYBIERZ LICZNIK (*), - 6 LICZBA (DISTINCT ID Działu), - 3 LICZBA (ID Działu) - 5 OD Pracownicy

WYBIERZ TOP 1 BonusPercent Z Pracowników GDZIE BonusPercent NIE JEST BRAK ZAMÓWIENIA WEDŁUG BonusPercent DESC - sortuj w porządku malejącym

MIN (procent bonusu)— zwraca minimalną wartość BonusPercent, ponownie z wyłączeniem wartości NULL. Podobnie jak w przypadku MAX, szukamy tylko wartości minimalnej, ignorując NULL:

Te. otrzymujemy następującą wartość:

WYBIERZ TOP 1 BonusPercent OD Pracowników GDZIE BonusPercent NIE JEST BRAK ZEROWY WEDŁUG BonusPercent - sortuj w porządku rosnącym

Wizualna reprezentacja MIN (BonusPercent) i MAX (BonusPercent):

SUMA (Wynagrodzenie / 100 * BonusProcent)- zwraca sumę wszystkich wartości innych niż NULL. Przeanalizuj wartości wyrażenia (Wynagrodzenie / 100 * BonusPercent):

Te. sumują się następujące wartości:

WYBIERZ Wynagrodzenie / 100 * BonusPercent FROM Pracowników GDZIE Wynagrodzenie / 100 * BonusPercent NIE JEST NULL

AVG (Wynagrodzenie / 100 * BonusProcent)- zwraca średnią wartości. Wyrażenia NULL są ignorowane, tj. to pasuje do drugiego wyrażenia:

Te. ponownie, wartości NULL nie są brane pod uwagę podczas liczenia ilości.

Jeśli musisz obliczyć średnią dla wszystkich pracowników, jak w trzecim wyrażeniu, które daje 554.166666666667, użyj wstępnej konwersji wartości NULL na zero:

SELECT AVG (ISNULL (Wynagrodzenie / 100 * Procent Bonusu, 0)), - 554.166666666667 SUM (Wynagrodzenie / 100 * Procent Bonusu) / LICZBA (*) - 554.166666666667 FROM Pracownicy

Podsumujmy niektóre wyniki:

COUNT (*) - służy do zliczania całkowitej liczby wierszy, które odebrał operator "SELECT...WHERE..."
we wszystkich pozostałych powyższych funkcjach agregujących przy obliczaniu sumy wartości NULL nie są brane pod uwagę
jeśli musimy wziąć pod uwagę wszystkie wiersze, jest to bardziej istotne dla funkcji AVG, wtedy najpierw musimy przetworzyć wartości NULL, na przykład, jak pokazano powyżej „AVG (ISNULL (Wynagrodzenie, 0))”

SELECT DepartmentID, PositionID, BonusPercent, Salary / 100 * BonusPercent, Salary FROM Employees WHERE DepartmentID = 3 - uwzględnij tylko dział IT

Identyfikator wydziału	Identyfikator pozycji	Procent bonusu	Wynagrodzenie / 100 * BonusProcent	Wynagrodzenie
3	3	15	225	1500
3	4	30	600	2000
3	3	ZERO	ZERO	1500

(Brak nazwy kolumny)	(Brak nazwy kolumny)	(Brak nazwy kolumny)	(Brak nazwy kolumny)
ZERO	ZERO	0	0

Uważam, że bardzo ważne jest zrozumienie celu każdej funkcji agregatu i sposobu jej obliczania, ponieważ w SQL jest to główne narzędzie do obliczania sum.

GROUP BY - grupowanie danych

Wcześniej obliczyliśmy już sumy dla konkretnego działu, mniej więcej w następujący sposób:

SELECT COUNT (DISTINCT PositionID) PositionCount, COUNT (*) EmplCount, SUM (Salary) SalaryAmount FROM Pracownicy WHERE ID działu = 3 - dane tylko dla działu IT

W rezultacie otrzymujemy 4 zbiory danych:

Należy pamiętać, że możemy używać pól określonych jako stałe - "Administracja", "Księgowość", ...

Ogólnie wydobyliśmy wszystkie liczby, o które nas poproszono, wszystko łączymy w Excelu i przekazujemy dyrektorowi.

Reżyserowi spodobał się raport i mówi: „i dodaj kolejną kolumnę z informacją o średniej pensji”. I jak zawsze trzeba to zrobić bardzo pilnie.

Hmm, co robić?! Ponadto wyobraźmy sobie, że nasze działy to nie 3, ale 15.

To jest dokładnie to, czym jest klauzula GROUP BY w takich przypadkach:

Identyfikator wydziału	Liczba pozycji	Liczba zatrudnionych	KwotaWynagrodzenia	Średnia pensja
ZERO	0	1	2000	2000
1	1	1	5000	5000
2	1	1	2500	2500
3	2	3	5000	1666.66666666667

Otrzymaliśmy wszystkie te same dane, ale teraz używamy tylko jednego żądania!

Na razie nie zwracajmy uwagi na to, że nasze działy są wyświetlane w postaci cyferek, wtedy nauczymy się jak pięknie wszystko wyeksponować.

Na przykład pogrupujmy dane według działów i stanowisk:

A potem wszystkie te wyniki są łączone i przekazywane nam jako jeden zestaw:

Z głównego warto zauważyć, że w przypadku grupowania (GROUP BY), na liście kolumn w bloku SELECT:

Możemy używać tylko kolumn wymienionych w klauzuli GROUP BY.
Możesz używać wyrażeń z polami z bloku GROUP BY
Możesz używać stałych, ponieważ nie wpływają na wynik grupowania
Wszystkie inne pola (nie wymienione w bloku GROUP BY) mogą być używane tylko z funkcjami agregacji (COUNT, SUM, MIN, MAX, ...)
Nie trzeba wymieniać wszystkich kolumn z klauzuli GROUP BY na liście kolumn SELECT

I demonstracja wszystkiego, co zostało powiedziane:

Warto również zauważyć, że grupowanie może odbywać się nie tylko według pól, ale także wyrażeń. Na przykład pogrupujmy dane według pracowników, według roku urodzenia:

SELECT CONCAT ("Rok urodzenia -", ROK (Urodziny)) YearOfBirthday, COUNT (*) EmplCount FROM Employees GROUP WEDŁUG ROKU (Urodziny)

Spójrzmy na przykład z bardziej złożonym wyrażeniem. Na przykład weźmy gradację pracowników według roku urodzenia:

Nazwa zakresu	Liczba zatrudnionych
1979-1970	1
1989-1980	2
nie wskazano	2
wcześniej 1970	1

Te. w tym przypadku grupowanie odbywa się według wyrażenia CASE wcześniej obliczonego dla każdego pracownika:

I oczywiście możesz łączyć wyrażenia z polami w bloku GROUP BY:

Ogólnie rzecz biorąc, nie martw się – wszyscy zaczynali od prostych. Na razie wystarczy zrozumieć istotę klauzuli GROUP BY.

Na koniec zobaczmy, jak można tworzyć raporty podsumowujące za pomocą funkcji GROUP BY.

Na przykład wyświetlmy tabelę przestawną, w kontekście działów, aby obliczyć łączne wynagrodzenie otrzymywane przez pracowników według stanowiska:

Możesz oczywiście zostać przepisany za pomocą IIF:

Ale w przypadku IIF będziemy musieli jawnie określić NULL, który zostanie zwrócony, jeśli warunek nie zostanie spełniony.

W podobnych przypadkach wolę używać CASE bez bloku ELSE niż ponownie pisać NULL. Ale to z pewnością kwestia gustu, o którą się nie dyskutuje.

A pamiętajmy, że w funkcjach agregujących nie są brane pod uwagę wartości NULL.

W celu konsolidacji dokonaj niezależnej analizy danych uzyskanych w ramach rozszerzonego żądania:

Identyfikator wydziału	Księgowy	Dyrektorzy	Programiści	Starsi programiści	Razem według działu
1	ZERO	5000	ZERO	ZERO	5000
3	ZERO	ZERO	1500	ZERO	1500
2	2500	ZERO	ZERO	ZERO	2500
3	ZERO	ZERO	ZERO	2000	2000
3	ZERO	ZERO	1500	ZERO	1500
ZERO	ZERO	ZERO	ZERO	ZERO	2000

Pamiętajmy też, że jeśli zamiast NULL chcemy widzieć zera, to możemy przetworzyć wartość zwracaną przez funkcję agregującą. Na przykład:

wyświetlaj nazwy oddziałów zamiast ich identyfikatorów, np. dodając wyrażenie CASE przetwarzające DepartmentID w bloku SELECT
dodaj sortowanie według nazwy działu za pomocą ORDER BY

Powiedzmy, że dotarłeś do tego punktu

Wybierz szczegółowe dane według klauzuli WHERE z jednej tabeli
Dowiedz się, jak korzystać z funkcji agregujących i grupowania z jednej tabeli

Ponieważ w pracy myśleli, że już wszystko umiesz, dostałeś dostęp do bazy danych (a czasem tak się dzieje), a teraz opracowałeś i wyciągasz ten bardzo tygodniowy raport dla dyrektora.

Tak, ale nie wzięli pod uwagę, że nie można jeszcze budować zapytań z kilku tabel, a tylko z jednej, tj. nie wiesz jak zrobić coś takiego:

Dlatego wszystko dobrze wyjaśniłeś, to informatycy od razu zrozumieli, czego od nich chcą i stworzyli specjalnie dla Ciebie widok o nazwie ViewEmployeesInfo.

Oświadczamy, że nie widzisz następnego polecenia, ponieważ Specjaliści IT to robią:

Możesz teraz pracować z tym widokiem jak ze zwykłą tabelą:

WYBIERZ * Z ZobaczInformacje o pracownikach

Dlatego teraz wszystkie dane potrzebne do raportu znajdują się w jednej „tabeli” (a la view), wtedy możesz łatwo przerobić raport tygodniowy:

Na przykład stwórzmy oświadczenie, aby upewnić się, że wszystko jest naprawdę tak, jak powiedziałem (że cała próbka pochodzi z jednego widoku):

WYBIERZ ID, Imię, Wynagrodzenie FROM ViewEmployeesInfo GDZIE Wynagrodzenie NIE JEST NULL I Wynagrodzenie> 0 ORDER BY Nazwa

Mam nadzieję, że ta prośba jest dla ciebie jasna.

Wycinek z Wikipedii. Chociaż SQL został pomyślany jako narzędzie dla użytkownika końcowego, w końcu stał się tak złożony, że stał się narzędziem programisty.

Jak widzicie, drodzy użytkownicy, język SQL został pierwotnie pomyślany jako narzędzie dla Was. Więc wszystko jest w twoich rękach i pragnieniu, nie odpuszczaj.

POSIADAJĄCY - nałożenie warunku selekcji na zgrupowane dane

Rozważmy przykład:

WYBIERZ IDDziału, SUMA (Wynagrodzenie) Wynagrodzenie Kwota Z Pracowników GRUPA WEDŁUG IDDziału POSIADAJĄC SUMA (Wynagrodzenie)> 3000

Identyfikator wydziału	KwotaWynagrodzenia
1	5000
3	5000