Bedingte Ausdrücke CASE. CASE-Bedingungsausdrücke CASE-Ausdruck ist eine bedingte Anweisung der SQL-Sprache

Es werden zwei Methoden verwendet:

CASE-Ausdruck

DECODE-Funktion

Die beiden Methoden, die verwendet werden, um die bedingte Verarbeitung (IF-THEN-ELSE-Logik) in einer SQL-Anweisung zu implementieren, sind der CASE-Ausdruck und die DECODE-Funktion.

Hinweis: Der CASE-Ausdruck entspricht ANSI SQL. Die DECODE-Funktion ist spezifisch für die Oracle-Syntax.

CASE-Ausdruck

Vereinfacht bedingte Abfragen, indem die IF-THEN-ELSE-Anweisung funktioniert:

Mit CASE-Ausdrücken können Sie die IF-THEN-ELSE-Logik in SQL-Anweisungen verwenden, ohne Prozeduren aufrufen zu müssen.

In einfach bedingter Ausdruck CASE Oracle Server sucht nach dem ersten WHEN ... THEN-Paar, für das expr gleich Comparison_expr ist und return_expr zurückgibt. Wenn keines der WHEN ... THEN-Paare diese Bedingung erfüllt und die else-Klausel existiert, gibt Oracle else_expr zurück. Andernfalls gibt Oracle null zurück. Sie können NULL nicht für alle return_exprs und else_expr angeben.

Ausdr und Vergleichsausdruck müssen denselben Datentyp haben, der CHAR, VARCHAR2, NCHAR oder NVARCHAR2 sein kann. Alle Rückgabewerte (return_expr) müssen vom gleichen Datentyp sein.

In dieser Syntax vergleicht Oracle den Eingabeausdruck (e) mit jedem Vergleichsausdruck e1, e2, ..., en.

Wenn der Eingabeausdruck einem Vergleichsausdruck entspricht, gibt der CASE-Ausdruck den entsprechenden Ergebnisausdruck (r) zurück.

Wenn der Eingabeausdruck e keinem Vergleichsausdruck entspricht, gibt der CASE-Ausdruck den Ausdruck in der ELSE-Klausel zurück, wenn die ELSE-Klausel vorhanden ist, andernfalls gibt er einen Nullwert zurück.

Oracle verwendet die Kurzschlussauswertung für den einfachen CASE-Ausdruck. Das bedeutet, dass Oracle jeden Vergleichsausdruck (e1, e2, .. en) erst auswertet, bevor einer von ihnen mit dem Eingabeausdruck (e) verglichen wird. Oracle wertet nicht alle Vergleichsausdrücke aus, bevor einer von ihnen mit dem Ausdruck (e) verglichen wird. Daher wertet Oracle niemals einen Vergleichsausdruck aus, wenn ein vorheriger gleich dem Eingabeausdruck (e) ist.

Beispiel für einen einfachen CASE-Ausdruck

Wir werden die Produkttabelle in der für die Demonstration verwenden.

Die folgende Abfrage verwendet den CASE-Ausdruck, um den Rabatt für jede Produktkategorie zu berechnen, d. h. CPU 5 %, Grafikkarte 10 % und andere Produktkategorien 8 %

AUSWÄHLEN

CASE-Kategorie_ID

WANN 1

DANN RUNDE (list_price * 0.05,2) - CPU

WANN 2

THEN ROUND (Listenpreis * 0.1,2) - Grafikkarte

ELSE ROUND (list_price * 0.08,2) - andere Kategorien

ENDE Rabatt

VON

SORTIEREN NACH

Beachten Sie, dass wir die Funktion ROUND() verwendet haben, um den Rabatt auf zwei Dezimalstellen zu runden.

Gesuchter CASE-Ausdruck

Der von Oracle durchsuchte CASE-Ausdruck wertet eine Liste von booleschen Ausdrücken aus, um das Ergebnis zu bestimmen.

Die gesuchte CASE-Anweisung hat die folgende Syntax:

FALL

WENN e1DANN r1

, COUNT (DISTINCT DepartmentID) [Anzahl eindeutiger Abteilungen], COUNT (DISTINCT PositionID) [Anzahl eindeutiger Positionen], COUNT (BonusPercent) [Anzahl Mitarbeiter mit % Bonus], MAX (BonusPercent) [Maximaler Bonusprozentsatz], MIN ( BonusPercent) [Mindestbonusprozentsatz], SUM (Gehalt / 100 * BonusPercent) [Summe aller Boni], AVG (Gehalt / 100 * BonusProzent) [Durchschnittsbonus], AVG (Gehalt) [Durchschnittsgehalt] VON Mitarbeitern

Aus Gründen der Übersichtlichkeit habe ich mich entschieden, hier eine Ausnahme zu machen und [...] die Syntax zum Definieren von Spaltenaliasen zu verwenden.

Werfen wir einen Blick darauf, wie die einzelnen Rückgabewerte entstanden sind, und erinnern wir uns auf einmal an die Konstruktionen der grundlegenden Syntax der SELECT-Anweisung.

Erstens, weil Wenn wir in der Abfrage keine WHERE-Bedingungen angegeben haben, werden die Summen für die detaillierten Daten berechnet, die durch die Abfrage erhalten werden:

AUSWÄHLEN * VON Mitarbeitern

Jene. für alle Zeilen der Employees-Tabelle.

Aus Gründen der Übersichtlichkeit wählen wir nur die Felder und Ausdrücke aus, die in Aggregatfunktionen verwendet werden:

SELECT DepartmentID, PositionID, BonusPercent, Gehalt / 100 * BonusPercent, Gehalt VON Mitarbeitern

Abteilungs-ID	Positions-ID	BonusProzent	Gehalt / 100 * BonusProzent	Gehalt
1	2	50	2500	5000
3	3	15	225	1500
2	1	NULL	NULL	2500
3	4	30	600	2000
3	3	NULL	NULL	1500
NULL	NULL	NULL	NULL	2000

Dies sind die Anfangsdaten (detaillierte Zeilen), anhand derer die Summen der aggregierten Abfrage berechnet werden.

Schauen wir uns nun jeden aggregierten Wert an:

ZÄHLEN (*)- schon seit wir die Filterbedingungen in der WHERE-Klausel in der Abfrage nicht angegeben haben, dann hat uns COUNT (*) die Gesamtzahl der Datensätze in der Tabelle angegeben, d.h. Dies ist die Anzahl der Zeilen, die von der Abfrage zurückgegeben werden:

AUSWÄHLEN * VON Mitarbeitern

ANZAHL (EINZELNE Abteilungs-ID)- hat uns den Wert 3 zurückgegeben, d.h. Diese Zahl entspricht der Anzahl der eindeutigen Abteilungswerte, die in der Spalte DepartmentID angegeben sind, ausgenommen NULL-Werte. Gehen wir die Werte der DepartmentID-Spalte durch und färben die gleichen Werte in eine Farbe ein (alle Methoden eignen sich gut zum Training):

Wir verwerfen NULL, wonach wir 3 eindeutige Werte (1, 2 und 3) erhalten haben. Jene. der von COUNT (DISTINCT DepartmentID) empfangene Wert kann in erweiterter Form durch folgende Auswahl dargestellt werden:

SELECT DISTINCT DepartmentID - 2. Nur eindeutige Werte von Mitarbeitern nehmen, WO DepartmentID NICHT NULL IST - 1. NULL-Werte verwerfen

ANZAHL (DISTINCT PositionID)- das gleiche wie bei COUNT (DISTINCT DepartmentID), nur das Feld PositionID. Wir schauen uns die Werte der Spalte PositionID an und bereuen die Farben nicht:

ANZAHL (BonusProzent)- gibt die Anzahl der Zeilen zurück, die den BonusPercent-Wert haben, d.h. zählt die Anzahl der Datensätze, für die BonusPercent NICHT NULL IST. Hier wird es für uns einfacher, denn keine Notwendigkeit, eindeutige Werte zu zählen, verwerfen Sie einfach Datensätze mit NULL-Werten. Wir nehmen die Werte der Spalte BonusPercent und streichen alle NULL-Werte durch:

Es sind noch 3 Werte übrig. Jene. in erweiterter Form kann die Stichprobe wie folgt dargestellt werden:

BonusPercent AUSWÄHLEN - 2. Alle Werte von Mitarbeitern übernehmen, WO BonusPercent NICHT NULL IST - 1. NULL-Werte verwerfen

Weil Da wir die Wörter DISTINCT nicht verwendet haben, werden wiederholte BonusPercent gezählt, falls vorhanden, ohne dass BonusPercent gleich NULL berücksichtigt wird. Vergleichen wir zum Beispiel das Ergebnis mit und ohne DISTINCT. Zur Verdeutlichung verwenden wir die Werte des DepartmentID-Felds:

ANZAHL AUSWÄHLEN (*), - 6 ANZAHL (EINZELNE Abteilungs-ID), - 3 ANZAHL (Abteilungs-ID) - 5 VON Mitarbeitern

MAX (BonusProzent)- gibt den maximalen BonusPercent-Wert zurück, wiederum ohne NULL-Werte.
Wir nehmen die Werte der Spalte BonusPercent und suchen den maximalen Wert darunter, wir achten nicht auf NULL-Werte:

SELECT TOP 1 BonusPercent FROM Employees WO BonusPercent NICHT NULL IST ORDNEN NACH BonusPercent DESC - in absteigender Reihenfolge sortieren

MIN (BonusProzent)- gibt den minimalen BonusPercent-Wert zurück, wiederum ohne NULL-Werte. Wie im Fall von MAX, nur nach dem Mindestwert suchen und NULL ignorieren:

Jene. wir erhalten folgenden Wert:

WÄHLEN SIE DIE TOP 1 BonusPercent VON Mitarbeitern AUS, WO BonusPercent NICHT NULL IST ORDNEN NACH BonusPercent - in aufsteigender Reihenfolge sortieren

Visuelle Darstellung von MIN (BonusPercent) und MAX (BonusPercent):

SUM (Gehalt / 100 * BonusProzent)- gibt die Summe aller Nicht-NULL-Werte zurück. Analysieren Sie die Werte des Ausdrucks (Gehalt / 100 * BonusPercent):

Jene. es werden folgende Werte addiert:

Gehalt auswählen / 100 * BonusPercent FROM Employees WO Gehalt / 100 * BonusPercent IS NOT NULL

AVG (Gehalt / 100 * BonusProzent)- gibt den Durchschnitt der Werte zurück. NULL-Ausdrücke werden ignoriert, d.h. dies entspricht dem zweiten Ausdruck:

AUSWÄHLEN AVG (Gehalt / 100 * BonusProzent), - 1108.3333333333 SUM (Gehalt / 100 * BonusProzent) / COUNT (Gehalt / 100 * BonusProzent), - 1108.3333333333 SUM (Gehalt / 100 * BonusProzent) / ANZAHL (*) - 554.166666666667 VON Mitarbeitern

Jene. Auch hier werden NULL-Werte beim Zählen der Menge nicht berücksichtigt.

Wenn Sie den Durchschnitt für alle Mitarbeiter berechnen müssen, wie im dritten Ausdruck, der 554.166666666667 ergibt, verwenden Sie die vorläufige Umrechnung von NULL-Werten in Null:

AVG AUSWÄHLEN (ISNULL (Gehalt / 100 * BonusProzent, 0)), - 554.166666666667 SUM (Gehalt / 100 * BonusProzent) / ANZAHL (*) - 554.166666666667 VON Mitarbeitern

AVG (Gehalt)- tatsächlich ist hier alles wie im vorherigen Fall, d.h. Wenn das Gehalt NULL ist, wird es nicht gezählt. Um jeweils alle Mitarbeiter zu berücksichtigen, führen Sie eine vorläufige NULL-Umrechnung der AVG-Werte durch (ISNULL (Gehalt, 0))

Fassen wir einige der Ergebnisse zusammen:

COUNT (*) - dient zum Zählen der Gesamtzahl der Zeilen, die vom Operator "SELECT ... WHERE ..." empfangen werden.
in allen anderen oben genannten Aggregatfunktionen bei der Berechnung der Summe werden NULL-Werte nicht berücksichtigt
Wenn wir alle Zeilen berücksichtigen müssen, ist dies für die AVG-Funktion relevanter, dann müssen wir zuerst NULL-Werte verarbeiten, zum Beispiel wie oben gezeigt "AVG (ISNULL (Salary, 0))"

Dementsprechend werden beim Setzen einer zusätzlichen Bedingung mit Aggregatfunktionen in der WHERE-Klausel nur Summen für Zeilen berechnet, die die Bedingung erfüllen. Jene. die Berechnung der Aggregatwerte erfolgt für den Gesamtsatz, der mit der SELECT-Konstruktion erhalten wird. Machen wir zum Beispiel alles gleich, aber nur im Kontext der IT-Abteilung:

SELECT COUNT (*) [Gesamtanzahl der Mitarbeiter], COUNT (DISTINCT DepartmentID) [Anzahl der eindeutigen Abteilungen], COUNT (DISTINCT PositionID) [Anzahl der eindeutigen Positionen], COUNT (BonusPercent) [Anzahl der Mitarbeiter mit % Bonus] , MAX (BonusPercent) [Maximaler Bonusprozentsatz], MIN (BonusPercent) [Mindestbonusprozentsatz], SUM (Gehalt / 100 * BonusPercent) [Summe aller Boni], AVG (Gehalt / 100 * BonusPercent) [Durchschnittliche Bonusgröße], AVG ( Gehalt) [Durchschnittsgehalt] FROM Employees WHERE DepartmentID = 3 - Nur IT-Abteilung berücksichtigen

Ich schlage vor, dass Sie zum besseren Verständnis der Arbeit von Aggregatfunktionen jeden erhaltenen Wert unabhängig analysieren. Wir führen hier Berechnungen entsprechend den detaillierten Daten durch, die wir bei der Anfrage erhalten haben:

SELECT DepartmentID, PositionID, BonusPercent, Salary / 100 * BonusPercent, Salary FROM Employees WHERE DepartmentID = 3 - nur IT-Abteilung einschließen

Abteilungs-ID	Positions-ID	BonusProzent	Gehalt / 100 * BonusProzent	Gehalt
3	3	15	225	1500
3	4	30	600	2000
3	3	NULL	NULL	1500

Weitergehen. Wenn die Aggregatfunktion NULL zurückgibt (z. B. haben nicht alle Mitarbeiter den Gehaltswert angegeben) oder kein einziger Datensatz in die Auswahl aufgenommen wurde und im Bericht in einem solchen Fall 0 angezeigt werden muss, dann Die ISNULL-Funktion kann den Aggregatausdruck umschließen:

SELECT SUM (Gehalt), AVG (Gehalt), - verarbeiten Sie die Summe mit ISNULL ISNULL (SUM (Gehalt), 0), ISNULL (AVG (Gehalt), 0) FROM Employees WHERE DepartmentID = 10 - eine nicht vorhandene Abteilung ist speziell hier angegeben, um zu verhindern, dass die Abfrage Datensätze zurückgibt

(Kein Spaltenname)	(Kein Spaltenname)	(Kein Spaltenname)	(Kein Spaltenname)
NULL	NULL	0	0

Ich glaube, dass es sehr wichtig ist, den Zweck jeder Aggregatfunktion und ihre Berechnung zu verstehen, denn in SQL ist es das Hauptwerkzeug zur Berechnung von Summen.

In diesem Fall haben wir untersucht, wie sich jede Aggregatfunktion unabhängig verhält, d.h. es wurde auf die Werte des gesamten Recordsets angewendet, die durch den SELECT-Befehl erhalten wurden. Als Nächstes sehen wir uns an, wie diese Funktionen verwendet werden, um Gruppensummen mit der GROUP BY-Klausel zu berechnen.

GROUP BY - Gruppieren von Daten

Zuvor haben wir die Summen für eine bestimmte Abteilung bereits grob wie folgt berechnet:

SELECT COUNT (DISTINCT PositionID) PositionCount, COUNT (*) EmplCount, SUM (Salary) SalaryAmount FROM Employees WHERE DepartmentID = 3 - Daten nur für IT-Abteilung

Stellen Sie sich nun vor, wir würden gebeten, für jede Abteilung die gleichen Zahlen zu erhalten. Natürlich können wir die Ärmel hochkrempeln und für jede Abteilung den gleichen Wunsch erfüllen. Gesagt, getan, schreiben wir 4 Anfragen:

SELECT "Administration" Info, COUNT (DISTINCT PositionID) PositionCount, COUNT (*) EmplCount, SUM (Salary) SalaryAmount FROM Employees WHERE DepartmentID = 1 - Daten zur Administration SELECT "Accounting" Info, COUNT (DISTINCT PositionID) PositionCount, COUNT ( * ) EmplCount, SUM (Salary) SalaryAmount FROM Employees WHERE DepartmentID = 2 - Buchhaltungsdaten SELECT "IT" Info, COUNT (DISTINCT PositionID) PositionCount, COUNT (*) EmplCount, SUM (Salary) SalaryAmount FROM Employees WHERE DepartmentID = 3 - Daten zu IT-Abteilung SELECT "Andere" Info, COUNT (DISTINCT PositionID) PositionCount, COUNT (*) EmplCount, SUM (Salary) SalaryAmount FROM Employees WHERE DepartmentID IS NULL - und Daten über Freelancer nicht vergessen

Als Ergebnis erhalten wir 4 Datensätze:

Bitte beachten Sie, dass wir als Konstanten angegebene Felder verwenden können - "Verwaltung", "Buchhaltung", ...

Im Allgemeinen haben wir alle Zahlen extrahiert, die von uns gefragt wurden, wir kombinieren alles in Excel und geben es dem Direktor weiter.

Dem Direktor gefiel der Bericht, und er sagt: "Und füge eine weitere Spalte mit Angaben zum Durchschnittsgehalt hinzu." Und das muss wie immer sehr dringend getan werden.

Hm, was tun?! Stellen wir uns außerdem vor, unsere Abteilungen sind nicht 3, sondern 15.

Genau das ist die GROUP BY-Klausel für solche Fälle:

SELECT DepartmentID, COUNT (DISTINCT PositionID) PositionCount, COUNT (*) EmplCount, SUM (Salary) SalaryAmount, AVG (Salary) SalaryAvg - plus wir erfüllen die Wünsche des Direktors FROM Employees GROUP BY DepartmentID

Abteilungs-ID	Positionsanzahl	EmplCount	GehaltBetrag	GehaltDurchschn
NULL	0	1	2000	2000
1	1	1	5000	5000
2	1	1	2500	2500
3	2	3	5000	1666.66666666667

Wir haben alle die gleichen Daten, aber jetzt mit nur einer Anfrage!

Achten Sie vorerst nicht darauf, dass unsere Abteilungen in Form von Zahlen angezeigt werden, dann lernen wir, wie man alles schön anzeigt.

In der GROUP BY-Klausel können Sie mehrere Felder angeben "GROUP BY field1, field2, ..., fieldN", in diesem Fall erfolgt die Gruppierung nach Gruppen, die die Werte dieser Felder "field1, field2, .. ., FeldN".

Lassen Sie uns die Daten beispielsweise nach Abteilungen und Positionen gruppieren:

SELECT DepartmentID, PositionID, COUNT (*) EmplCount, SUM (Salary) SalaryAmount FROM Employees GROUP BY DepartmentID, PositionID

Danach wird jede Kombination durchlaufen und die Berechnungen der Aggregatfunktionen durchgeführt:

SELECT COUNT (*) EmplCount, SUM (Salary) SalaryAmount FROM Employees WHERE DepartmentID IS NULL AND PositionID IS NULL SELECT COUNT (*) EmplCount, SUM (Salary) SalaryAmount FROM Employees WHERE DepartmentID = 1 AND PositionID = 2 - ... SELECT COUNT (*) EmplCount, SUM (Salary) SalaryAmount FROM Employees WHERE DepartmentID = 3 AND PositionID = 4

Und dann werden all diese Ergebnisse miteinander kombiniert und uns als ein Set übergeben:

Aus der Hauptsache ist zu beachten, dass im Falle einer Gruppierung (GROUP BY) in der Liste der Spalten im SELECT-Block:

Wir können nur die Spalten verwenden, die in der GROUP BY-Klausel aufgeführt sind.
Sie können Ausdrücke mit Feldern aus dem GROUP BY-Block verwenden
Sie können Konstanten verwenden, da sie haben keinen Einfluss auf das Gruppierungsergebnis
Alle anderen Felder (nicht im GROUP BY-Block aufgeführt) können nur mit Aggregatfunktionen (COUNT, SUM, MIN, MAX, ...) verwendet werden.
Es ist nicht erforderlich, alle Spalten aus der GROUP BY-Klausel in der SELECT-Spaltenliste aufzulisten

Und eine Demonstration von allem, was gesagt wurde:

SELECT "String-Konstante" Const1, - Konstante in Form von String 1 Const2, - Konstante in Form einer Zahl - Ausdruck über die an der Gruppe beteiligten Felder CONCAT ("Department No.", DepartmentID) ConstAndGroupField, CONCAT ("Department No.", DepartmentID , ", Position No.", PositionID) ConstAndGroupFields, DepartmentID, - Feld aus der Liste der an der Gruppierung teilnehmenden Felder - PositionID, - das an der Gruppierung teilnehmende Feld, hier muss nicht dupliziert werden COUNT ( *) EmplCount, - Anzahl der Zeilen in jeder Gruppe - die restlichen Felder können nur mit Aggregatfunktionen verwendet werden: COUNT, SUM, MIN, MAX,… SUM (Salary) SalaryAmount, MIN (ID) MinID FROM Employees GROUP BY DepartmentID , PositionID - Gruppierung nach Feldern DepartmentID, PositionID

Es ist auch erwähnenswert, dass die Gruppierung nicht nur nach Feldern, sondern auch nach Ausdrücken erfolgen kann. Gruppieren wir die Daten beispielsweise nach Mitarbeitern, nach Geburtsjahr:

KONKAT AUSWÄHLEN ("Geburtsjahr -", JAHR (Geburtstag)) YearOfBirthday, COUNT (*) EmplCount FROM Employees GRUPPE NACH JAHR (Geburtstag)

Betrachten wir ein Beispiel mit einem komplexeren Ausdruck. Nehmen wir zum Beispiel die Abstufung der Mitarbeiter nach Geburtsjahr:

FALL WÄHLEN WHEN JAHR (Geburtstag)> = 2000 DANN "von 2000" WHEN JAHR (Geburtstag)> = 1990 THEN "1999-1990" WHEN JAHR (Geburtstag)> = 1980 THEN "1989-1980" WHEN JAHR (Geburtstag)> = 1970 DANN "1979-1970" WENN Geburtstag NICHT NULL IST DANN "vor 1970" ELSE "nicht angegeben" END Bereichsname, ANZAHL (*) EmplCount FROM Employees GROUP BY CASE WHEN YEAR (Geburtstag)> = 2000 THEN "from 2000" WHEN YEAR (Geburtstag)> = 1990 DANN "1999-1990" WENN JAHR (Geburtstag)> = 1980 DANN "1989-1980" WENN JAHR (Geburtstag)> = 1970 DANN "1979-1970" WENN Geburtstag NICHT NULL IST DANN "vor 1970" ELSE "nicht angegeben" END

Bereichsname	EmplCount
1979-1970	1
1989-1980	2
nicht angezeigt	2
früher 1970	1

Jene. in diesem Fall erfolgt die Gruppierung nach dem zuvor für jeden Mitarbeiter berechneten CASE-Ausdruck:

ID, CASE AUSWÄHLEN WHEN JAHR (Geburtstag)> = 2000 DANN "ab 2000" WHEN JAHR (Geburtstag)> = 1990 THEN "1999-1990" WHEN JAHR (Geburtstag)> = 1980 THEN "1989-1980" WHEN JAHR (Geburtstag) > = 1970 DANN "1979-1970" WENN Geburtstag NICHT NULL IST DANN "vor 1970" ELSE "keine Angabe" END FROM Mitarbeiter

Und natürlich können Sie Ausdrücke mit Feldern im GROUP BY-Block kombinieren:

SELECT DepartmentID, CONCAT ("Geburtsjahr -", YEAR (Birthday)) YearOfBirthday, COUNT (*) EmplCount FROM Employees GROUP BY YEAR (Geburtstag), DepartmentID - die Reihenfolge stimmt möglicherweise nicht mit der Reihenfolge ihrer Verwendung in der SELECT ORDER überein BY DepartmentID-Block, YearOfBirthday - endlich können wir das Ergebnis sortieren

Kehren wir zu unserer ursprünglichen Aufgabe zurück. Wie wir bereits wissen, hat dem Direktor der Bericht sehr gut gefallen und er hat uns gebeten, ihn wöchentlich zu machen, damit er die Veränderungen im Unternehmen verfolgen kann. Um nicht jedes Mal in Excel den Zahlenwert der Abteilung durch seinen Namen zu unterbrechen, werden wir das bereits vorhandene Wissen nutzen und unsere Abfrage verbessern:

SELECT CASE DepartmentID WHEN 1 DANN "Administration" WHEN 2 DANN "Accounting" WHEN 3 THEN "ES" ELSE "Other" END Info, COUNT (DISTINCT PositionID) PositionCount, COUNT (*) EmplCount, SUM (Salary) SalaryAmount, AVG (Salary ) SalaryAvg - plus wir erfüllen die Wünsche des Direktors FROM Mitarbeiter GRUPPE NACH Abteilungs-ID BESTELLEN NACH Info - Sortierung nach der Info-Spalte für mehr Komfort hinzufügen

Obwohl es von außen beängstigend aussehen mag, ist es immer noch besser als es ursprünglich war. Der Nachteil ist, dass wir beim Start einer neuen Abteilung und deren Mitarbeitern den CASE-Ausdruck hinzufügen müssen, damit die Mitarbeiter der neuen Abteilung nicht in die Gruppe "Sonstige" gelangen.

Aber nichts, im Laufe der Zeit werden wir lernen, alles schön zu machen, sodass unsere Auswahl nicht vom Erscheinen neuer Daten in der Datenbank abhängt, sondern dynamisch ist. Ich werde ein wenig vorausgehen, um zu zeigen, welche Art von Anfragen wir versuchen zu erreichen:

SELECT ISNULL (abh.Name, "Andere") AbhName, COUNT (DISTINCT emp.PositionID) PositionCount, COUNT (*) EmplCount, SUM (em.Salary) SalaryAmount, AVG (em.Salary) SalaryAvg - plus die Wünsche der Direktor FROM Mitarbeiter emp LEFT JOIN Abteilungen dep ON emp.DepartmentID = dep.ID GROUP BY em.DepartmentID, dep.Name ORDER BY DepName

Im Allgemeinen keine Sorge – alle haben einfach angefangen. Im Moment müssen Sie nur den Kern der GROUP BY-Klausel verstehen.

Sehen wir uns abschließend an, wie Sie mit GROUP BY zusammenfassende Berichte erstellen können.

Lassen Sie uns beispielsweise eine Pivot-Tabelle im Kontext von Abteilungen anzeigen, damit das Gesamtgehalt der Mitarbeiter nach Position berechnet wird:

SELECT DepartmentID, SUM (CASE WHEN PositionID = 1 THEN Salary END) [Buchhalter], SUM (CASE WHEN PositionID = 2 THEN Salary END) [Directors], SUM (CASE WHEN PositionID = 3 THEN Salary END) [Programmierer], SUM ( CASE WHEN PositionID = 4 THEN Salary END) [Senior Programmers], SUM (Gehalt) [Department Total] FROM Employees GROUP BY DepartmentID

Jene. Wir können beliebige Ausdrücke innerhalb von Aggregatfunktionen frei verwenden.

Sie können natürlich mit IIF umgeschrieben werden:

SELECT DepartmentID, SUM (IIF (PositionID = 1, Gehalt, NULL)) [Buchhalter], SUM (IIF (PositionID = 2, Gehalt, NULL)) [Direktoren], SUM (IIF (PositionID = 3, Gehalt, NULL)) [Programmierer], SUM (IIF (PositionID = 4, Gehalt, NULL)) [Senior Programmierer], SUM (Gehalt) [Abteilung Gesamt] FROM Mitarbeiter GRUPPE NACH Abteilungs-ID

Im Fall von IIF müssen wir jedoch explizit NULL angeben, was zurückgegeben wird, wenn die Bedingung nicht erfüllt ist.

In ähnlichen Fällen verwende ich lieber CASE ohne einen ELSE-Block, als noch einmal NULL zu schreiben. Aber das ist sicherlich Geschmackssache, worüber nicht gestritten wird.

Und denken wir daran, dass NULL-Werte in Aggregationsfunktionen nicht berücksichtigt werden.

Führen Sie zur Konsolidierung eine unabhängige Analyse der durch die erweiterte Anfrage erhaltenen Daten durch:

SELECT DepartmentID, CASE WHEN PositionID = 1 THEN Salary END [Buchhalter], CASE WHEN PositionID = 2 THEN Salary END [Directors], CASE WHEN PositionID = 3 THEN Salary END [Programmierer], CASE WHEN PositionID = 4 THEN Salary END [Senior Programmers ], Gehalt [Abteilung Gesamt] VON Mitarbeitern

Abteilungs-ID	Buchhalter	Direktoren	Programmierer	Erfahrene Programmierer	Gesamt nach Abteilung
1	NULL	5000	NULL	NULL	5000
3	NULL	NULL	1500	NULL	1500
2	2500	NULL	NULL	NULL	2500
3	NULL	NULL	NULL	2000	2000
3	NULL	NULL	1500	NULL	1500
NULL	NULL	NULL	NULL	NULL	2000

Und denken wir auch daran, dass wir, wenn wir anstelle von NULL Nullen sehen möchten, den von der Aggregatfunktion zurückgegebenen Wert verarbeiten können. Zum Beispiel:

SELECT DepartmentID, ISNULL (SUM (IIF (PositionID = 1, Gehalt, NULL)), 0) [Buchhalter], ISNULL (SUM (IIF (PositionID = 2, Gehalt, NULL)), 0) [Directors], ISNULL (SUM (IIF (PositionID = 3, Gehalt, NULL)), 0) [Programmierer], ISNULL (SUM (IIF (PositionID = 4, Gehalt, NULL)), 0) [Senior Programmierer], ISNULL (SUM (Gehalt), 0 ) [Abteilung Gesamt] FROM Mitarbeiter GRUPPE NACH Abteilungs-ID

Jetzt können Sie zu Übungszwecken:

die Namen von Abteilungen anstelle ihrer Bezeichner anzeigen, indem Sie beispielsweise einen CASE-Ausdruck hinzufügen, der Abteilungs-ID im SELECT-Block verarbeitet
Sortieren nach Abteilungsname mit ORDER BY . hinzufügen

GROUP BY in spärlicher Form mit Aggregatfunktionen, eines der wichtigsten Werkzeuge, um zusammenfassende Daten aus der Datenbank zu erhalten, da die Daten normalerweise in dieser Form verwendet werden, weil wir sind in der Regel verpflichtet, zusammenfassende Berichte statt detaillierte Daten (Blätter) bereitzustellen. Und natürlich dreht sich alles darum, das Grunddesign zu kennen, denn bevor Sie etwas zusammenfassen (aggregieren), müssen Sie es zuerst mit "SELECT ... WHERE ..." richtig auswählen.

Üben hat hier also einen wichtigen Platz, wenn Sie sich zum Ziel setzen, die SQL-Sprache zu verstehen, nicht zu lernen, sondern zu verstehen - üben, üben und üben, die unterschiedlichsten Möglichkeiten durchgehen, die Ihnen einfallen.

Wenn Sie sich in der Anfangsphase über die Richtigkeit der erhaltenen aggregierten Daten nicht sicher sind, erstellen Sie eine detaillierte Stichprobe, einschließlich aller Werte, für die die Aggregation durchgeführt wird. Und überprüfen Sie die Richtigkeit der Berechnungen manuell anhand dieser detaillierten Daten. In diesem Fall kann die Verwendung von Excel sehr hilfreich sein.

Sagen wir, du bist an diesem Punkt angekommen

Nehmen wir an, Sie sind Buchhalter S. S. Sidorov, der beschlossen hat, SELECT-Abfragen zu schreiben.
Nehmen wir an, Sie haben dieses Tutorial bis zu diesem Punkt bereits zu Ende gelesen und wenden bereits alle oben genannten Grundkonstruktionen souverän an, d. du kannst:

Detaillierte Daten nach WHERE-Klausel aus einer Tabelle auswählen
Wissen, wie man Aggregatfunktionen und Gruppierungen aus einer Tabelle verwendet

Da man bei der Arbeit dachte, man wüsste schon, wie man alles macht, bekam man Zugang zur Datenbank (und das passiert manchmal), und jetzt haben Sie genau diesen wöchentlichen Bericht für den Direktor entwickelt und ziehen ihn heraus.

Ja, aber sie haben nicht berücksichtigt, dass Sie immer noch keine Abfragen aus mehreren Tabellen erstellen können, sondern nur aus einer, d.h. Du weißt nicht, wie man so etwas macht:

SELECT Emp. *, - alle Felder der Tabelle Employees dep.Name DepartmentName zurückgeben, - das Feld Name aus der Tabelle Departments pos.Name PositionName zu diesen Feldern hinzufügen - und auch das Feld Name aus der Tabelle Positions FROM Employees Emp LEFT JOIN . hinzufügen Abteilungen dep ON emp.DepartmentID = dep.ID LEFT JOIN Positionen pos ON emp.PositionID = pos.ID

Auch wenn Sie nicht wissen, wie das geht, glauben Sie mir, Sie sind ein feiner Kerl und haben schon so viel erreicht.

Wie können Sie also Ihr aktuelles Wissen nutzen und gleichzeitig noch produktivere Ergebnisse erzielen?! Nutzen wir die Kraft des kollektiven Geistes - wir gehen zu den Programmierern, die für Sie arbeiten, d.h. an Andreev A.A., Petrov P.P. oder Nikolayev N.N., und bitten Sie jemanden, eine Ansicht für Sie zu schreiben (VIEW oder einfach "View", damit sie Sie sogar schneller verstehen), die zusätzlich zu den Hauptfeldern aus der Tabelle Employees auch Felder mit zurückgibt „Der Name der Abteilung“ und „Der Name der Stelle“, die Ihnen jetzt für den Wochenbericht, den Ivanov II. Ihnen hochgeladen hat, so fehlen.

Weil Sie haben alles richtig erklärt, dann haben die IT-Spezialisten sofort verstanden, was sie von ihnen wollten und haben speziell für Sie eine Ansicht namens ViewEmployeesInfo erstellt.

Wir stellen dar, dass Sie den nächsten Befehl nicht sehen, weil IT-Spezialisten machen es:

CREATE VIEW ViewEmployeesInfo AS SELECT Emp. *, - alle Felder der Tabelle Employees dep.Name DepartmentName zurückgeben, - das Feld Name aus der Tabelle Departments pos.Name PositionName zu diesen Feldern hinzufügen - und auch das Feld Name aus der Tabelle Positions FROM Mitarbeiter em LEFT JOIN Abteilungen dep ON emp.DepartmentID = dep.ID LEFT JOIN Positionen pos ON emp.PositionID = pos.ID

Jene. für Sie bleibt all dies zwar gruselig und unverständlich, Text bleibt aus dem Bildschirm, und IT-Spezialisten nennen Ihnen nur den Namen der Ansicht "ViewEmployeesInfo", die alle oben genannten Daten zurückgibt (dh wonach Sie gefragt haben).

Sie können nun mit dieser Ansicht wie mit einer regulären Tabelle arbeiten:

AUSWÄHLEN * VON ViewEmployeesInfo

Weil jetzt befinden sich alle für den Bericht notwendigen Daten in einer "Tabelle" (a la view), dann können Sie Ihren Wochenbericht ganz einfach wiederholen:

SELECT DepartmentName, COUNT (DISTINCT PositionID) PositionCount, COUNT (*) EmplCount, SUM (Salary) SalaryAmount, AVG (Salary) SalaryAvg FROM ViewEmployeesInfo emp GROUP BY DepartmentID, DepartmentName ORDER BY DepartmentName

Jetzt sind alle Namen der Abteilungen im Feld, außerdem ist die Anfrage dynamisch geworden und ändert sich, wenn neue Abteilungen und deren Mitarbeiter hinzugefügt werden, d. Jetzt müssen Sie nichts mehr wiederholen, aber es reicht aus, die Anfrage einmal pro Woche auszuführen und ihr Ergebnis dem Direktor mitzuteilen.

Jene. für Sie arbeiten Sie in diesem Fall, als ob sich nichts geändert hätte, weiter mit einer Tabelle (richtiger wäre es aber mit der Ansicht ViewEmployeesInfo), die alle benötigten Daten zurückliefert. Dank der Hilfe von IT-Spezialisten bleiben die Details des Mining von DepartmentName und PositionName für Sie in einer Blackbox. Jene. die Ansicht sieht für Sie genauso aus wie eine normale Tabelle, betrachten Sie sie als erweiterte Version der Tabelle Employees.

Lassen Sie uns zum Beispiel eine Aussage als Beispiel bilden, damit Sie sicherstellen, dass wirklich alles so ist, wie ich es sagte (dass das gesamte Beispiel aus einer Sicht stammt):

WÄHLEN Sie ID, Name, Gehalt AUS ViewEmployeesInfo WO Gehalt NICHT NULL IST UND Gehalt> 0 BESTELLEN NACH Name

Ich hoffe, diese Bitte ist Ihnen klar.

Die Verwendung von Views ermöglicht es in einigen Fällen, die Grenzen der Benutzer, die grundlegende SELECT-Abfragen schreiben können, erheblich zu erweitern. In diesem Fall ist die Ansicht eine flache Tabelle mit allen Daten, die der Benutzer benötigt (für diejenigen, die OLAP verstehen, kann dies mit einer Annäherung an einen OLAP-Würfel mit Fakten und Dimensionen verglichen werden).

Ausschnitt aus Wikipedia. Obwohl SQL als Werkzeug für den Endbenutzer gedacht war, wurde es schließlich so komplex, dass es zu einem Programmierwerkzeug wurde.

Wie Sie sehen, liebe Benutzer, wurde die Sprache SQL ursprünglich als Werkzeug für Sie konzipiert. Also, alles liegt in Ihren Händen und Verlangen, lassen Sie Ihre Hände nicht los.

HAVING - Auferlegen einer Auswahlbedingung für gruppierte Daten

Wenn Sie verstehen, was eine Gruppierung ist, dann ist mit HAVING nichts Kompliziertes. HAVING ähnelt WHERE, nur wenn die WHERE-Bedingung auf detaillierte Daten angewendet wird, wird die HAVING-Bedingung auf die bereits gruppierten Daten angewendet. Aus diesem Grund können wir in den Bedingungen des HAVING-Blocks entweder Ausdrücke verwenden, deren Felder in der Gruppierung enthalten sind, oder Ausdrücke, die in Aggregatfunktionen eingeschlossen sind.

Betrachten wir ein Beispiel:

SELECT DepartmentID, SUM (Gehalt) SalaryAmount FROM Employees GRUPPE NACH Abteilungs-ID HAVING SUM (Gehalt)> 3000

Abteilungs-ID	GehaltBetrag
1	5000
3	5000

Jene. Diese Anfrage hat uns nur die gruppierten Daten für die Abteilungen zurückgegeben, für die das Gesamtgehalt aller Mitarbeiter 3000 überschreitet, d.h. "SUMME (Gehalt) > 3000".

Jene. hier erfolgt zunächst die Gruppierung und die Daten für alle Abteilungen werden berechnet:

SELECT DepartmentID, SUM (Salary) SalaryAmount FROM Employees GROUP BY DepartmentID - 1. Gruppierte Daten für alle Abteilungen abrufen

Und schon wird auf diese Daten die im HAVING-Block angegebene Bedingung angewendet:

SELECT DepartmentID, SUM (Salary) SalaryAmount FROM Employees GROUP BY DepartmentID - 1. Gruppierte Daten für alle Abteilungen abrufen HAVING SUM (Salary)> 3000 - 2.Bedingung zum Filtern von gruppierten Daten

In der HAVING-Bedingung können Sie auch komplexe Bedingungen mit den Operatoren AND, OR und NOT erstellen:

SELECT DepartmentID, SUM (Gehalt) SalaryAmount FROM Employees GRUPPE NACH Abteilungs-ID HABEN SUMME (Gehalt)> 3000 UND ZÄHLEN (*)<2 -- и число людей меньше 2-х

Wie Sie hier sehen, kann die Aggregatfunktion (siehe "COUNT (*)") nur im HAVING-Block angegeben werden.

Dementsprechend können wir nur die Nummer der Abteilung anzeigen, die der Bedingung HAVING entspricht:

WÄHLEN SIE Abteilungs-ID FROM Mitarbeiter GRUPPE NACH Abteilungs-ID HABEN SUMME (Gehalt)> 3000 UND ZÄHL (*)<2 -- и число людей меньше 2-х

Ein Beispiel für die Verwendung der HAVING-Bedingung für ein Feld, das in der GROUP BY enthalten ist:

SELECT DepartmentID, SUM (Salary) SalaryAmount FROM Employees GROUP BY DepartmentID - 1. die Gruppierung HAVING DepartmentID = 3 machen - 2. das Gruppierungsergebnis filtern

Dies ist nur ein Beispiel, da In diesem Fall wäre es logischer, eine WHERE-Bedingung zu überprüfen:

SELECT DepartmentID, SUM (Salary) SalaryAmount FROM Employees WHERE DepartmentID = 3 - 1. Detaillierte Daten filtern GROUP BY DepartmentID - 2. Gruppierung nur nach ausgewählten Datensätzen vornehmen

Jene. Filtern Sie zuerst die Mitarbeiter nach Abteilung 3 und führen Sie erst dann eine Berechnung durch.

Notiz. Obwohl die beiden Abfragen unterschiedlich aussehen, kann der DBMS-Optimierer sie auf die gleiche Weise ausführen.

Ich denke, hier kann die Geschichte über das HABEN von Bedingungen enden.

Fassen wir zusammen

Fassen wir die im zweiten und dritten Teil erhaltenen Daten zusammen und betrachten wir den spezifischen Standort jeder von uns untersuchten Struktur und geben wir die Reihenfolge ihrer Implementierung an:

Bau / Block	Ausführungsreihenfolge	Funktion ausgeführt
SELECT-Rückgabeausdrücke	4	Rückgabe der auf Anfrage erhaltenen Daten
AUS Quelle	0	In unserem Fall sind dies bisher alle Zeilen der Tabelle.
WHERE Quellenauswahlbedingung	1	Nur Zeilen, die der Bedingung entsprechen, werden ausgewählt
GROUP BY-Gruppierungsausdrücke	2	Erstellt Gruppen nach dem angegebenen Gruppierungsausdruck. Berechnung von aggregierten Werten für diese Gruppen, die in SELECT- oder HAVING-Blöcken verwendet werden
HAVING Filter für gruppierte Daten	3	Auf gruppierte Daten angewendete Filterung
ORDER BY-Ausdruck, um das Ergebnis zu sortieren	5	Sortieren von Daten nach dem angegebenen Ausdruck

Natürlich können Sie die Klauseln DISTINCT und TOP, die Sie in Teil 2 gelernt haben, auch auf gruppierte Daten anwenden.

Diese Vorschläge gelten in diesem Fall für das Endergebnis:

SELECT TOP 1 - 6. wird die letzte SUMME (Gehalt) anwenden SalaryAmount FROM Employees GRUPPE NACH Abteilungs-ID HAVING SUM (Gehalt)> 3000 BESTELLEN NACH Abteilungs-ID - 5.sortieren Sie das Ergebnis

Analysieren Sie selbst, wie diese Ergebnisse erzielt wurden.

Abschluss

Das Hauptziel, das ich in diesem Teil festgelegt habe, besteht darin, Ihnen die Essenz von Aggregatfunktionen und Gruppierungen aufzuzeigen.

Wenn das grundlegende Design es uns ermöglichte, die erforderlichen Detaildaten zu erhalten, dann gab uns die Anwendung von Aggregatfunktionen und Gruppierungen auf diese Detaildaten die Möglichkeit, zusammenfassende Daten darüber zu erhalten. Also, wie Sie sehen, ist hier alles wichtig, tk. das eine baut auf dem anderen auf - ohne Kenntnis der Grundstruktur werden wir zum Beispiel die Daten, für die wir die Summen berechnen müssen, nicht richtig auswählen können.

Hier versuche ich bewusst nur die Basics zu zeigen, um die Aufmerksamkeit des Anfängers auf die wichtigsten Strukturen zu lenken und diese nicht mit unnötigen Informationen zu überfrachten. Ein solides Verständnis der grundlegenden Strukturen (über die ich in den folgenden Teilen weiter sprechen werde) gibt Ihnen die Möglichkeit, fast jedes Problem beim Abrufen von Daten aus einer RDB zu lösen. Die Grundkonstruktionen der SELECT-Anweisung sind in fast allen DBMS in gleicher Form anwendbar (die Unterschiede liegen hauptsächlich in den Details, zB in der Implementierung von Funktionen - für das Arbeiten mit Strings, Zeit etc.).

Anschließend haben Sie durch solide Grundkenntnisse die Möglichkeit, verschiedene Erweiterungen der SQL-Sprache auf einfache Weise selbstständig zu erlernen, wie zum Beispiel:

GRUPPE NACH ROLLUP (…), GRUPPE NACH GRUPPIERUNGSSETS (…),…
PIVOT, UNPIVOT
usw.

Für die Zwecke dieses Tutorials habe ich mich entschieden, nicht über diese Erweiterungen zu sprechen, weil und ohne deren Wissen, nur die grundlegenden Konstruktionen der SQL-Sprache zu kennen, können Sie eine Vielzahl von Problemen lösen. Erweiterungen der SQL-Sprache dienen nämlich der Lösung eines bestimmten Aufgabenspektrums, d.h. erlauben, ein Problem einer bestimmten Klasse eleganter zu lösen (aber nicht immer effizienter in Bezug auf Geschwindigkeit oder Ressourcenverbrauch).

Wenn Sie Ihre ersten Schritte in SQL machen, dann konzentrieren Sie sich zunächst auf das Studium grundlegender Konstrukte, da Wenn Sie die Basis besitzen, wird alles andere für Sie viel einfacher zu verstehen sein, und außerdem auf eigene Faust. Zuallererst müssen Sie die Fähigkeiten der SQL-Sprache gründlich verstehen, d.h. welche Art von Operation es im Allgemeinen erlaubt, mit Daten durchzuführen. Anfängern Informationen in voluminöser Form zu vermitteln ist ein weiterer Grund, warum ich nur die wichtigsten (Eisen-)Strukturen zeige.

Viel Glück beim Lernen und Verstehen der SQL-Sprache.

Teil vier -

Teil eins - habrahabr.ru/post/255361
Teil zwei - habrahabr.ru/post/255523

Was wird in diesem Teil besprochen

In diesem Teil lernen wir:

mit einem CASE-Ausdruck, der es Ihnen ermöglicht, bedingte Ausdrücke in die Abfrage aufzunehmen;
mit Aggregatfunktionen, die es Ihnen ermöglichen, alle Arten von Summen (aggregierte Werte) zu erhalten, die auf der Grundlage detaillierter Daten berechnet werden, die der Operator "SELECT ... WHERE ..." erhalten hat;
mit der GROUP BY-Klausel, die es Ihnen trotz Aggregatfunktionen ermöglicht, Summen für Detaildaten im Kontext von Gruppen zu erhalten;
mit einer HAVING-Klausel, mit der Sie nach gruppierten Daten filtern können.

CASE-Ausdruck - Bedingte SQL-Anweisung

Mit diesem Operator können Sie die Bedingungen überprüfen und je nach Erfüllung einer bestimmten Bedingung das eine oder andere Ergebnis zurückgeben.

Die CASE-Anweisung hat 2 Formen:

Als Bedeutungen können auch Ausdrücke verwendet werden.

Nehmen wir ein Beispiel für das erste CASE-Formular:

WÄHLEN Sie ID, Name, Gehalt, FALL WHEN Gehalt> = 3000 DANN "RFP> = 3000" WHEN Gehalt> = 2000 DANN "2000<= ЗП < 3000" ELSE "ЗП < 2000" END SalaryTypeWithELSE, CASE WHEN Salary>= 3000 DANN "Gehalt> = 3000" WANN Gehalt> = 2000 DANN "2000<= ЗП < 3000" END SalaryTypeWithoutELSE FROM Employees

WHEN-Bedingungen werden nacheinander von oben nach unten getestet. Wenn die erste erfüllende Bedingung erreicht ist, wird die weitere Prüfung abgebrochen und der nach dem THEN-Wort für diese WHEN-Klausel angegebene Wert zurückgegeben.

Wenn keine der WHEN-Bedingungen erfüllt ist, wird der nach dem Wort ELSE angegebene Wert zurückgegeben (was in diesem Fall "ELSE RETURN ..." bedeutet).

Wenn kein ELSE-Block angegeben ist und keine WHEN-Bedingungen erfüllt sind, wird NULL zurückgegeben.

Sowohl in der ersten als auch in der zweiten Form steht der ELSE-Block ganz am Ende der CASE-Struktur, d.h. nach allen WANN-Bedingungen.

Nehmen wir ein Beispiel für das zweite CASE-Formular:

Nehmen wir an, für das neue Jahr haben sie beschlossen, alle Mitarbeiter zu belohnen, und baten darum, die Höhe der Boni nach dem folgenden Schema zu berechnen:

Geben Sie den Mitarbeitern der IT-Abteilung 15% des Gehalts;
Angestellte der Buchhaltung 10 % des Gehalts;
Der Rest 5 % des Gehalts.

Für diese Aufgabe verwenden wir eine Abfrage mit einem CASE-Ausdruck:

SELECT ID, Name, Salary, DepartmentID, - aus Gründen der Übersichtlichkeit werden wir den Prozentsatz als Zeile anzeigen CASE DepartmentID - der geprüfte Wert WHEN 2 DANN "10%" - 10% des Gehalts für Buchhalter WHEN 3 THEN "15%" " - 15% vom Gehalt, um es an IT-Mitarbeiter zu geben ELSE "5%" - an alle anderen 5% END NewYearBonusPercent, - Lassen Sie uns mit CASE einen Ausdruck erstellen, um die Höhe des Bonusgehalts / 100 * CASE DepartmentID WHEN 2 THEN . zu sehen 10 - 10 % des auszugebenden Gehalts Für Buchhalter WANN 3 DANN 15 - 15 % des auszugebenden Gehalts IT-Mitarbeiter SONST 5 - alle anderen je 5 % ENDE Bonusbetrag FROM Mitarbeiter

Dies führt eine sequentielle Überprüfung des DepartmentID-Werts gegen WHEN-Werte durch. Wenn die erste DepartmentID einem WHEN-Wert entspricht, wird die Prüfung abgebrochen und der nach dem THEN-Wort für diese WHEN-Klausel angegebene Wert zurückgegeben.

Dementsprechend wird der Wert des ELSE-Blocks zurückgegeben, wenn die DepartmentID mit keinem WHEN-Wert übereinstimmt.

Wenn kein ELSE-Block vorhanden ist, wird NULL zurückgegeben, wenn DepartmentID keinem WHEN-Wert entspricht.

Die zweite CASE-Form lässt sich mit der ersten Form einfach darstellen:

SELECT ID, Name, Salary, DepartmentID, CASE WHEN DepartmentID = 2 THEN "10%" - 10% des Gehalts für Buchhalter WHEN DepartmentID = 3 THEN "15%" - 15% des Gehalts für IT-Mitarbeiter ELSE " 5% "- alle anderen 5% END NewYearBonusPercent, - Erstellen Sie einen Ausdruck mit CASE, um den Bonusbetrag anzuzeigen Gehalt / 100 * CASE WHEN DepartmentID = 2 THEN 10 - 10% des Gehalts für Buchhalter WHEN DepartmentID = 3 DANN 15 - 15% des Gehalts für IT-Mitarbeiter ELSE 5 - alle anderen jeweils 5% ENDE Bonusbetrag FROM Mitarbeiter

Die zweite Form ist also nur eine vereinfachte Notation für die Fälle, in denen wir einen Gleichheitsvergleich desselben Testwerts mit jedem WHEN-Wert / -Ausdruck durchführen müssen.

Notiz. Die erste und zweite Form von CASE sind im SQL-Sprachstandard enthalten, daher sollten sie höchstwahrscheinlich in vielen DBMS anwendbar sein.

Mit MS SQL Version 2012 ist eine vereinfachte IIF-Notationsform erschienen. Es kann verwendet werden, um eine CASE-Anweisung zu vereinfachen, wenn nur 2 Werte zurückgegeben werden. Das IIF-Design sieht wie folgt aus:

IIF (Bedingung, wahrer_Wert, falscher_Wert)

Jene. Tatsächlich ist es ein Wrapper für die folgende CASE-Konstruktion:

CASE WHEN Bedingung THEN true_value ELSE false_value END

Sehen wir uns ein Beispiel an:

SELECT ID, Name, Gehalt, IIF (Gehalt> = 2500, "Gehalt> = 2500", "Gehalt< 2500") DemoIIF, CASE WHEN Salary>= 2500 DANN "RFP> = 2500" ELSE "RFP< 2500" END DemoCASE FROM Employees

CASE-, IIF-Konstrukte können ineinander verschachtelt werden. Betrachten wir ein abstraktes Beispiel:

SELECT ID, Name, Salary, CASE WHEN DepartmentID IN (1,2) THEN "A" WHEN DepartmentID = 3 THEN CASE PositionID - verschachtelt CASE WHEN 3 THEN "B-1" WHEN 4 THEN "B-2" END ELSE " C "END Demo1, IIF (DepartmentID IN (1,2)," A ", IIF (DepartmentID = 3, CASE PositionID WHEN 3 THEN" B-1 "WHEN 4 THEN" B-2 "END," C ")) Demo2 VON Mitarbeitern

Da die Konstrukte CASE und IIF Ausdrücke sind, die ein Ergebnis zurückgeben, können wir sie nicht nur im SELECT-Block verwenden, sondern auch in anderen Blöcken, die die Verwendung von Ausdrücken ermöglichen, beispielsweise in den Klauseln WHERE oder ORDER BY.

Stellen wir uns zum Beispiel die Aufgabe vor, eine Liste für die Gehaltsverteilung zu erstellen, wie folgt:

Zuallererst sollten Gehälter von Mitarbeitern erhalten werden, deren Gehalt weniger als 2500 beträgt
Diejenigen Mitarbeiter, die ein Gehalt größer oder gleich 2.500 haben, erhalten an zweiter Stelle Gehälter
Innerhalb dieser beiden Gruppen müssen Sie die Leitungen nach dem vollständigen Namen ordnen (Feld Name).

Versuchen wir, dieses Problem zu lösen, indem wir dem ORDER BY-Block einen CASE-Ausdruck hinzufügen:

ID, Name, Gehalt VON Mitarbeitern AUSWÄHLEN NACH FALL BESTELLEN WHEN Gehalt> = 2500 DANN 1 ELSE 0 END, - zuerst ein Gehalt an diejenigen ausgeben, die weniger als 2500 haben Name - die Liste weiter nach dem vollständigen Namen sortieren

Wie wir sehen, werden Ivanov und Sidorov die letzten sein, die die Arbeit verlassen.

Und ein abstraktes Beispiel für die Verwendung von CASE in einer WHERE-Klausel:

SELECT ID, Name, Gehalt FROM Mitarbeiter WHERE CASE WHEN Gehalt> = 2500 THEN 1 ELSE 0 END = 1 - alle Datensätze, deren Ausdruck 1 ist

Sie können versuchen, die letzten 2 Beispiele mit der IIF-Funktion selbst zu wiederholen.

Und schließlich erinnern wir uns noch einmal an NULL-Werte:

SELECT ID, Name, Salary, DepartmentID, CASE WHEN DepartmentID = 2 THEN "10%" - 10% des Gehalts für Buchhalter WHEN DepartmentID = 3 DANN "15%" - 15% des Gehalts an IT-Mitarbeiter WHEN DepartmentID IS NULL THEN "-" - wir geben keine Boni an Freiberufler (wir verwenden IS NULL) ELSE "5%" - alle anderen haben jeweils 5% END NewYearBonusPercent1, - aber Sie können nicht auf NULL prüfen, denken Sie daran, was über NULL gesagt wurde im zweiten Teil der CASE DepartmentID - - geprüfter Wert WHEN 2 DANN "10%" WHEN 3 DANN "15%" WHEN NULL THEN "-" - !!! in diesem Fall ist die Verwendung des zweiten CASE-Formulars nicht geeignet ELSE "5%" END NewYearBonusPercent2 FROM Employees

Natürlich könntest du so etwas umschreiben:

SELECT ID, Name, Salary, DepartmentID, CASE ISNULL (DepartmentID, -1) - verwenden Sie die Ersetzung bei NULL durch -1 WHEN 2 THEN "10%" WHEN 3 THEN "15%" WHEN -1 THEN "-" - wenn wir sicher sind, dass es keine Abteilung mit der ID gleich (-1) gibt und es nicht ELSE "5%" geben wird END NewYearBonusPercent3 FROM Employees

Im Allgemeinen ist der Fantasie in diesem Fall keine Grenzen gesetzt.

Sehen wir uns zum Beispiel an, wie die ISNULL-Funktion mit CASE und IIF modelliert werden kann:

SELECT ID, Name, LastName, ISNULL (LastName, "Unspecified") DemoISNULL, CASE WHEN LastName IS NULL THEN "Unspecified" ELSE LastName END DemoCASE, IIF (LastName IS NULL, "Unspecified", LastName) DemoIIF FROM Employees

Das CASE-Konstrukt ist eine sehr leistungsstarke SQL-Funktion, mit der Sie zusätzliche Logik zur Berechnung der Werte der Ergebnismenge auferlegen können. In diesem Teil wird uns der Besitz der CASE-Konstruktion noch nützlich sein, daher wird in diesem Teil zunächst darauf geachtet.

Aggregatfunktionen

Hier werden nur die grundlegenden und am häufigsten verwendeten Aggregatfunktionen behandelt:

Name	Beschreibung
ZÄHLEN (*)	Gibt die Anzahl der Zeilen zurück, die der Operator "SELECT ... WHERE ..." erhalten hat. Ohne WHERE die Anzahl aller Datensätze in der Tabelle.
ANZAHL (Spalte / Ausdruck)	Gibt die Anzahl der Nicht-NULL-Werte in der angegebenen Spalte / dem angegebenen Ausdruck zurück
ANZAHL (DISTINCT Spalte / Ausdruck)	Gibt die Anzahl der eindeutigen Nicht-NULL-Werte in der angegebenen Spalte / dem angegebenen Ausdruck zurück
SUM (Spalte / Ausdruck)	Gibt die Summe über die Werte einer Spalte / eines Ausdrucks zurück
AVG (Spalte / Ausdruck)	Gibt den Durchschnitt über die Werte der Spalte / des Ausdrucks zurück. NULL-Werte werden beim Zählen nicht gezählt.
MIN (Spalte / Ausdruck)	Gibt den Mindestwert über die Werte einer Spalte / eines Ausdrucks zurück
MAX (Spalte / Ausdruck)	Gibt den maximalen Wert über die Werte einer Spalte / eines Ausdrucks zurück

Mit Aggregatfunktionen können wir den Gesamtwert für eine Reihe von Zeilen berechnen, die mit der SELECT-Anweisung erhalten wurden.

Schauen wir uns jede Funktion mit einem Beispiel an:

SELECT COUNT (*) [Gesamtanzahl der Mitarbeiter], COUNT (DISTINCT DepartmentID) [Anzahl der eindeutigen Abteilungen], COUNT (DISTINCT PositionID) [Anzahl der eindeutigen Positionen], COUNT (BonusPercent) [Anzahl der Mitarbeiter mit % Bonus] , MAX (BonusPercent) [Maximaler Bonusprozentsatz], MIN (BonusPercent) [Mindestbonusprozentsatz], SUM (Gehalt / 100 * BonusPercent) [Summe aller Boni], AVG (Gehalt / 100 * BonusPercent) [Durchschnittliche Bonusgröße], AVG ( Gehalt) [Durchschnittsgehalt] VON Mitarbeitern

Aus Gründen der Übersichtlichkeit habe ich mich entschieden, hier eine Ausnahme zu machen und [...] die Syntax zum Definieren von Spaltenaliasen zu verwenden.

Werfen wir einen Blick darauf, wie die einzelnen Rückgabewerte entstanden sind, und erinnern wir uns auf einmal an die Konstruktionen der grundlegenden Syntax der SELECT-Anweisung.

Erstens, weil Wenn wir in der Abfrage keine WHERE-Bedingungen angegeben haben, werden die Summen für die detaillierten Daten berechnet, die durch die Abfrage erhalten werden:

AUSWÄHLEN * VON Mitarbeitern

Jene. für alle Zeilen der Employees-Tabelle.

Aus Gründen der Übersichtlichkeit wählen wir nur die Felder und Ausdrücke aus, die in Aggregatfunktionen verwendet werden:

SELECT DepartmentID, PositionID, BonusPercent, Gehalt / 100 * BonusPercent, Gehalt VON Mitarbeitern

Abteilungs-ID	Positions-ID	BonusProzent	Gehalt / 100 * BonusProzent	Gehalt
1	2	50	2500	5000
3	3	15	225	1500
2	1	NULL	NULL	2500
3	4	30	600	2000
3	3	NULL	NULL	1500
NULL	NULL	NULL	NULL	2000

Dies sind die Anfangsdaten (detaillierte Zeilen), anhand derer die Summen der aggregierten Abfrage berechnet werden.

Schauen wir uns nun jeden aggregierten Wert an:

AUSWÄHLEN * VON Mitarbeitern

SELECT DISTINCT DepartmentID - 2. Nur eindeutige Werte von Mitarbeitern nehmen, WO DepartmentID NICHT NULL IST - 1. NULL-Werte verwerfen

ANZAHL (DISTINCT PositionID)- das gleiche wie bei COUNT (DISTINCT DepartmentID), nur das Feld PositionID. Wir schauen uns die Werte der Spalte PositionID an und bereuen die Farben nicht:

Es sind noch 3 Werte übrig. Jene. in erweiterter Form kann die Stichprobe wie folgt dargestellt werden:

BonusPercent AUSWÄHLEN - 2. Alle Werte von Mitarbeitern übernehmen, WO BonusPercent NICHT NULL IST - 1. NULL-Werte verwerfen

ANZAHL AUSWÄHLEN (*), - 6 ANZAHL (EINZELNE Abteilungs-ID), - 3 ANZAHL (Abteilungs-ID) - 5 VON Mitarbeitern

SELECT TOP 1 BonusPercent FROM Employees WO BonusPercent NICHT NULL IST ORDNEN NACH BonusPercent DESC - in absteigender Reihenfolge sortieren

MIN (BonusProzent)- gibt den minimalen BonusPercent-Wert zurück, wiederum ohne NULL-Werte. Wie im Fall von MAX, nur nach dem Mindestwert suchen und NULL ignorieren:

Jene. wir erhalten folgenden Wert:

WÄHLEN SIE DIE TOP 1 BonusPercent VON Mitarbeitern AUS, WO BonusPercent NICHT NULL IST ORDNEN NACH BonusPercent - in aufsteigender Reihenfolge sortieren

Visuelle Darstellung von MIN (BonusPercent) und MAX (BonusPercent):

SUM (Gehalt / 100 * BonusProzent)- gibt die Summe aller Nicht-NULL-Werte zurück. Analysieren Sie die Werte des Ausdrucks (Gehalt / 100 * BonusPercent):

Jene. es werden folgende Werte addiert:

Gehalt auswählen / 100 * BonusPercent FROM Employees WO Gehalt / 100 * BonusPercent IS NOT NULL

AVG (Gehalt / 100 * BonusProzent)- gibt den Durchschnitt der Werte zurück. NULL-Ausdrücke werden ignoriert, d.h. dies entspricht dem zweiten Ausdruck:

Jene. Auch hier werden NULL-Werte beim Zählen der Menge nicht berücksichtigt.

Wenn Sie den Durchschnitt für alle Mitarbeiter berechnen müssen, wie im dritten Ausdruck, der 554.166666666667 ergibt, verwenden Sie die vorläufige Umrechnung von NULL-Werten in Null:

AVG AUSWÄHLEN (ISNULL (Gehalt / 100 * BonusProzent, 0)), - 554.166666666667 SUM (Gehalt / 100 * BonusProzent) / ANZAHL (*) - 554.166666666667 VON Mitarbeitern

Fassen wir einige der Ergebnisse zusammen:

COUNT (*) - dient zum Zählen der Gesamtzahl der Zeilen, die vom Operator "SELECT ... WHERE ..." empfangen werden.
in allen anderen oben genannten Aggregatfunktionen bei der Berechnung der Summe werden NULL-Werte nicht berücksichtigt
Wenn wir alle Zeilen berücksichtigen müssen, ist dies für die AVG-Funktion relevanter, dann müssen wir zuerst NULL-Werte verarbeiten, zum Beispiel wie oben gezeigt "AVG (ISNULL (Salary, 0))"

SELECT DepartmentID, PositionID, BonusPercent, Salary / 100 * BonusPercent, Salary FROM Employees WHERE DepartmentID = 3 - nur IT-Abteilung einschließen

Abteilungs-ID	Positions-ID	BonusProzent	Gehalt / 100 * BonusProzent	Gehalt
3	3	15	225	1500
3	4	30	600	2000
3	3	NULL	NULL	1500

(Kein Spaltenname)	(Kein Spaltenname)	(Kein Spaltenname)	(Kein Spaltenname)
NULL	NULL	0	0

Ich glaube, dass es sehr wichtig ist, den Zweck jeder Aggregatfunktion und ihre Berechnung zu verstehen, denn in SQL ist es das Hauptwerkzeug zur Berechnung von Summen.

GROUP BY - Gruppieren von Daten

Zuvor haben wir die Summen für eine bestimmte Abteilung bereits grob wie folgt berechnet:

SELECT COUNT (DISTINCT PositionID) PositionCount, COUNT (*) EmplCount, SUM (Salary) SalaryAmount FROM Employees WHERE DepartmentID = 3 - Daten nur für IT-Abteilung

Als Ergebnis erhalten wir 4 Datensätze:

Bitte beachten Sie, dass wir als Konstanten angegebene Felder verwenden können - "Verwaltung", "Buchhaltung", ...

Im Allgemeinen haben wir alle Zahlen extrahiert, die von uns gefragt wurden, wir kombinieren alles in Excel und geben es dem Direktor weiter.

Dem Direktor gefiel der Bericht, und er sagt: "Und füge eine weitere Spalte mit Angaben zum Durchschnittsgehalt hinzu." Und das muss wie immer sehr dringend getan werden.

Hm, was tun?! Stellen wir uns außerdem vor, unsere Abteilungen sind nicht 3, sondern 15.

Genau das ist die GROUP BY-Klausel für solche Fälle:

Abteilungs-ID	Positionsanzahl	EmplCount	GehaltBetrag	GehaltDurchschn
NULL	0	1	2000	2000
1	1	1	5000	5000
2	1	1	2500	2500
3	2	3	5000	1666.66666666667

Wir haben alle die gleichen Daten, aber jetzt mit nur einer Anfrage!

Achten Sie vorerst nicht darauf, dass unsere Abteilungen in Form von Zahlen angezeigt werden, dann lernen wir, wie man alles schön anzeigt.

Lassen Sie uns die Daten beispielsweise nach Abteilungen und Positionen gruppieren:

Und dann werden all diese Ergebnisse miteinander kombiniert und uns als ein Set übergeben:

Aus der Hauptsache ist zu beachten, dass im Falle einer Gruppierung (GROUP BY) in der Liste der Spalten im SELECT-Block:

Wir können nur die Spalten verwenden, die in der GROUP BY-Klausel aufgeführt sind.
Sie können Ausdrücke mit Feldern aus dem GROUP BY-Block verwenden
Sie können Konstanten verwenden, da sie haben keinen Einfluss auf das Gruppierungsergebnis
Alle anderen Felder (nicht im GROUP BY-Block aufgeführt) können nur mit Aggregatfunktionen (COUNT, SUM, MIN, MAX, ...) verwendet werden.
Es ist nicht erforderlich, alle Spalten aus der GROUP BY-Klausel in der SELECT-Spaltenliste aufzulisten

Und eine Demonstration von allem, was gesagt wurde:

Es ist auch erwähnenswert, dass die Gruppierung nicht nur nach Feldern, sondern auch nach Ausdrücken erfolgen kann. Gruppieren wir die Daten beispielsweise nach Mitarbeitern, nach Geburtsjahr:

KONKAT AUSWÄHLEN ("Geburtsjahr -", JAHR (Geburtstag)) YearOfBirthday, COUNT (*) EmplCount FROM Employees GRUPPE NACH JAHR (Geburtstag)

Betrachten wir ein Beispiel mit einem komplexeren Ausdruck. Nehmen wir zum Beispiel die Abstufung der Mitarbeiter nach Geburtsjahr:

Bereichsname	EmplCount
1979-1970	1
1989-1980	2
nicht angezeigt	2
früher 1970	1

Jene. in diesem Fall erfolgt die Gruppierung nach dem zuvor für jeden Mitarbeiter berechneten CASE-Ausdruck:

Und natürlich können Sie Ausdrücke mit Feldern im GROUP BY-Block kombinieren:

Im Allgemeinen keine Sorge – alle haben einfach angefangen. Im Moment müssen Sie nur den Kern der GROUP BY-Klausel verstehen.

Sehen wir uns abschließend an, wie Sie mit GROUP BY zusammenfassende Berichte erstellen können.

Lassen Sie uns beispielsweise eine Pivot-Tabelle im Kontext von Abteilungen anzeigen, damit das Gesamtgehalt der Mitarbeiter nach Position berechnet wird:

Sie können natürlich mit IIF umgeschrieben werden:

Im Fall von IIF müssen wir jedoch explizit NULL angeben, was zurückgegeben wird, wenn die Bedingung nicht erfüllt ist.

In ähnlichen Fällen verwende ich lieber CASE ohne einen ELSE-Block, als noch einmal NULL zu schreiben. Aber das ist sicherlich Geschmackssache, worüber nicht gestritten wird.

Und denken wir daran, dass NULL-Werte in Aggregationsfunktionen nicht berücksichtigt werden.

Führen Sie zur Konsolidierung eine unabhängige Analyse der durch die erweiterte Anfrage erhaltenen Daten durch:

Abteilungs-ID	Buchhalter	Direktoren	Programmierer	Erfahrene Programmierer	Gesamt nach Abteilung
1	NULL	5000	NULL	NULL	5000
3	NULL	NULL	1500	NULL	1500
2	2500	NULL	NULL	NULL	2500
3	NULL	NULL	NULL	2000	2000
3	NULL	NULL	1500	NULL	1500
NULL	NULL	NULL	NULL	NULL	2000

Und denken wir auch daran, dass wir, wenn wir anstelle von NULL Nullen sehen möchten, den von der Aggregatfunktion zurückgegebenen Wert verarbeiten können. Zum Beispiel:

die Namen von Abteilungen anstelle ihrer Bezeichner anzeigen, indem Sie beispielsweise einen CASE-Ausdruck hinzufügen, der Abteilungs-ID im SELECT-Block verarbeitet
Sortieren nach Abteilungsname mit ORDER BY . hinzufügen

Sagen wir, du bist an diesem Punkt angekommen

Detaillierte Daten nach WHERE-Klausel aus einer Tabelle auswählen
Wissen, wie man Aggregatfunktionen und Gruppierungen aus einer Tabelle verwendet

Ja, aber sie haben nicht berücksichtigt, dass Sie immer noch keine Abfragen aus mehreren Tabellen erstellen können, sondern nur aus einer, d.h. Du weißt nicht, wie man so etwas macht:

Weil Sie haben alles richtig erklärt, dann haben die IT-Spezialisten sofort verstanden, was sie von ihnen wollten und haben speziell für Sie eine Ansicht namens ViewEmployeesInfo erstellt.

Wir stellen dar, dass Sie den nächsten Befehl nicht sehen, weil IT-Spezialisten machen es:

Sie können nun mit dieser Ansicht wie mit einer regulären Tabelle arbeiten:

AUSWÄHLEN * VON ViewEmployeesInfo

Weil jetzt befinden sich alle für den Bericht notwendigen Daten in einer "Tabelle" (a la view), dann können Sie Ihren Wochenbericht ganz einfach wiederholen:

Lassen Sie uns zum Beispiel eine Aussage als Beispiel bilden, damit Sie sicherstellen, dass wirklich alles so ist, wie ich es sagte (dass das gesamte Beispiel aus einer Sicht stammt):

WÄHLEN Sie ID, Name, Gehalt AUS ViewEmployeesInfo WO Gehalt NICHT NULL IST UND Gehalt> 0 BESTELLEN NACH Name

Ich hoffe, diese Bitte ist Ihnen klar.

Ausschnitt aus Wikipedia. Obwohl SQL als Werkzeug für den Endbenutzer gedacht war, wurde es schließlich so komplex, dass es zu einem Programmierwerkzeug wurde.

Wie Sie sehen, liebe Benutzer, wurde die Sprache SQL ursprünglich als Werkzeug für Sie konzipiert. Also, alles liegt in Ihren Händen und Verlangen, lassen Sie Ihre Hände nicht los.

HAVING - Auferlegen einer Auswahlbedingung für gruppierte Daten

Betrachten wir ein Beispiel:

SELECT DepartmentID, SUM (Gehalt) SalaryAmount FROM Employees GRUPPE NACH Abteilungs-ID HAVING SUM (Gehalt)> 3000

Abteilungs-ID	GehaltBetrag
1	5000
3	5000