Разрешается использовать только для ознакомления, по вопросам приобретения или распространения книг обращаться к их авторам или издательствам. (с) Народная библиотека BIGLIB.COM.UA -------------------------------------------------------------------------- Маpтин Грубеp Понимание SQL Пеpевод Лебедева В.Н. Редакция Булычева В.Н. СОДЕРЖАНИЕ ГЛАВ КНИГИ 1 Введение в Реляционные Базы Данных 1 2 SQL: Краткий Обзор 11 3 Использование SQL Для Извлечения Информации из Таблиц 21 4 Использование Реляционных и Булевых Операторов при Создании более Сложных Предикатов 35 5 Использование Специальных Операторов в Условиях 47 6 Обобщение Данных с помощью Агрегатных Функций 61 7 Форматирование Вывода Запроса 75 8 Запрос Многих Таблиц Как Одной 87 9 Объединение Таблицы с Собой 97 10 Помещение Одного Запроса Внутрь Другого 109 11 Соотнесенные Подзапросы 125 12 Использование Оператора EXISTS 137 13 Использование Операторов ANY, ALL, и SOME 149 14 Использование Предложения UNION 169 15 Введение, Удаление, и Изменение Значения Поля 185 16 Использование Подзапросов с Командами Модификации 195 17 Создание Таблиц 207 18 Ограничение Значений Ваших Данных 217 19 Поддержание Целостности Ваших Данных 233 20 Введение: Представления 251 21 Изменение Значений с Помощью Представлений 265 22 Определение Кто Что Может Делать 279 23 Глобальные Аспекты SQL 297 24 Как Данные SQL Сожержатся в Упорядоченном Виде 313 25 Использование SQL с Другими Языками ( Вложенный SQL ) 333 A Ответы для Упражнений 359 B Типы SQL Данных 381 C Некоторые Общие Нестандартные Особенности SQL 387 D Синтаксис и Команды Ссылки 399 E Таблицы Используемые в Примерах 419 ОГЛАВЛЕНИЕ ГЛАВА 1: ВВЕДЕНИЕ В РЕЛЯЦИОННЫЕ БАЗЫ ДАННЫХ Что такое - Реляционная База Данных? 2 Как связываются Таблицы друг с другом 3 Порядок Строк Произволен 3 Идентификация Строки ( Первичный Ключ ) 4 Столбцы Именуются и Нумеруются 4 Типовая База Данных 5 Резюме 8 Работа с SQL 9 ГЛАВА 2: SOL: КРАТКИЙ ОБЗОР Как SQL Работает ? 12 Как ANSI относится к SQL? 12 Интерактивный и Вложенный SQL 13 Подразделы SQL 13 Различные Типы Данных 14 SQL Несогласованности 15 Что такое - ПОЛЬЗОВАТЕЛЬ? 17 Условные Обозначения и Терминология 17 Резюме 18 Работа с SQL 18 ГЛАВА 3: ИСПОЛЬЗОВАНИЕ SQL ДЛЯ ИЗВЛЕЧЕНИЯ ИНФОРМАЦИИ ИЗ ТАБЛИЦЫ Создание Запроса 22 Где Работают Запросы ? 22 Команда SELECT 23 Выбирайте Всегда Простой Способ 25 Кратко о SELECT 25 Представление Только Определенных Столбцов Таблицы 25 Переупорядочение Столбцов 26 Удаление Избыточных Данных 27 Квалифицированный Выбор - Предложение WHERE 29 Резюме 32 Работа с SQL 33 ГЛАВА 4: ИСПОЛЬЗОВАНИЕ РЕЛЯЦИОННЫХ И БУЛЕВЫХ ОПЕРАТОРОВ ДЛЯ СОЗДАНИЯ БОЛЕЕ СЛОЖНЫХ ПРЕДИКАТОВ Реляционные Операторы 36 Булевы Операторы 37 Резюме 43 Работа с SQL 45 ГЛАВА 5: ИСПОЛЬЗОВАНИЕ СПЕЦИАЛЬНЫХ ОПЕРАТОРОВ В УСЛОВИЯХ Оператор IN 48 Оператор BETWEEN 50 Оператор LIKE 53 Работа с NULL Значениями 56 Оператор IS NULL 57 Использование NOT со Специальными Операторами 57 Резюме 59 Работа с SQL 60 ГЛАВА 6: ОБОБЩЕНИЕ ДАННЫХ С ПОМОЩЬЮ АГРЕГАТНЫХ ФУНКЦИЙ Что Такое Агрегатные Функции? 62 Зачем Используют Агрегатные Функции? 62 Специальный Атрибут COUNT 64 Создание Агрегатов в Скалярных Выражениях 67 Предложение GROUP BY 67 Предложение HAVING 69 Не Делайте Вложенных Агрегатов 72 Резюме 73 Работа с SQL 74 ГЛАВА 7: ФОРМИРОВАНИЕ ВЫВОДА ЗАПРОСА Строки и Выражения 76 Упорядочение Вывода с помощью Полей 79 Упорядочение с помощью Многочисленых Столбцов 80 Упорядочение Агрегатных Групп 81 Упорядочение Вывода по Номеру Столбца 82 ORDER BY с NULL Значениями 84 Резюме 85 Работа с SQL 86 ГЛАВА 8: ЗАПРОС МНОГИХ ТАБЛИЦ КАК ОДНОЙ Объединение Таблиц 88 Имена Таблиц и Имена Столбцов 88 Создание Объединения 89 Объединение Таблиц через Справочную Целостность 90 Эквивалентные Объединения и Другие Виды Обьединений 91 Обьединение Более Двух Таблиц 92 Резюме 93 Работа с SQL 95 ГЛАВА 9: ОБЪЕДИНЕНИЕ ТАБЛИЦ С СОБОЙ Как Делается Объединение Таблицы с Собой ? 98 Псевдонимы 98 Удаление Избыточности 100 Проверки Ошибок 101 Больше Псевдонимов 102 Некоторые Более Комплексные Объединения 102 Резюме 105 Работа с SQL 107 ГЛАВА 10: ПОМЕЩЕНИЕ ОДНОГО ЗАПРОСА ВНУТРЬ ДРУГОГО Как Работают Подзапросы ? 110 Значения Которые Подзапрос Может Выводить 111 DISTINCT с Подзапросами 112 Предикаты с Подзапросами - Не Обратимы 114 Использование Агрегатных Функций в Подзапросах 114 Использование Подзапросов Для Вывода Многих Строк с помощью IN 116 Подзапросы в HAVING 121 Резюме 122 Работа с SQL 123 ГЛАВА 11: СООТНЕСЕННЫЕ ПОДЗАПРОСЫ Как Формировать Соотнесенный Подзапрос 126 Как Работает Соотнесенный Подзапрос 126 Использовать Соотнесенные Подзапросы чтобы Находить Ошибки 130 Соотнесение Таблицы с Собой 131 Соотнесенные Подзапросы в HAVING 132 Соотнесенные Подзапросы и Объединения 133 Резюме 134 Работа с SQL 135 ГЛАВА 12: ИСПОЛЬЗОВАНИЕ ОПЕРАТОРА EXISTS Как Работает EXISTS ? 138 Выбор Столбцов с помощью EXISTS 139 Использование EXISTS с Соотнесенными Подзапросами 139 Комбинация EXISTS и Объединения 141 Использование NOT EXISTS 142 EXISTS и Агрегаты 142 Улучшеный Пример Подзапроса 143 Резюме 146 Работа с SQL 147 ГЛАВА 13: ИСПОЛЬЗОВАНИЕ ОПЕРАТОРОВ ANY, ALL, И SOME Специальный Оператор ANY или SOME 150 Использование IN или EXISTS вместо ANY 151 Как ANY Может Быть Неоднозначным 154 Специальный Оператор ALL 158 Равенства и Неравенства 159 Понимание ANY и ALL 162 Как ANY, ALL, и EXISTS Обращается с Отсутствием Данных и Неизвестными Данными 162 Когда Подзапрос Возвращается Пустым 162 ANY и ALL вместо EXISTS с NULL 163 Использование COUNT вместо EXISTS 164 Резюме 166 Работа с SQL 167 ГЛАВА 14: ИСПОЛЬЗОВАНИЕ ПРЕДЛОЖЕНИЯ UNION Объединение Многих Запросов в Один 170 Когда Вы Можете Делать Объединение между Запросами ? 171 UNION и Удаление Дубликатов 172 Использование Строк и Выражений с UNION 174 Использование UNION с ORDER BY 175 Внешнее Обьединение 177 Резюме 181 Работа с SQL 183 ГЛАВА 15: ВВЕДЕНИЕ, УДАЛЕНИЕ, И ИЗМЕНЕНИЕ ЗНАЧЕНИЯ ПОЛЯ Команды Модификации DML 186 Ввод Значений 186 Вставка NULL 187 Наименование Столбцов для Вставки 187 Вставка Результатов Запроса 188 Удаление Строк из Таблиц 189 Изменение Значений Поля 190 МОДИФИЦИРОВАНИЕ Только Определенных Строк 190 UPDATE с Многочислеными Столбцами 190 Использование Выражений в UPDATE 191 МОДИФИЦИРОВАНИЕ для NULL Значениq 192 Резюме 192 Работа с SQL 193 ГЛАВА 16: ИСПОЛЬЗОВАНИЕ ПОДЗАПРОСОВ С КОМАНДОЙ UPDATE Использование Подзапросов с INSERT 196 Не Вставка Дубликатов Строк 197 Использование Подзапросов Созданых во Внешних Запросах к Таблице 198 Использование Подзапросов с DELETE 199 Использование Подзапросов с UPDATE 202 Знакомство с Ограничениями Подзапросов Команд DML 203 Резюме 204 Работа с SQL 205 ГЛАВА 17: СОЗДАНИЕ ТАБЛИЦ Команда CREATE TABLE 208 Индексы 210 Уникальные Индексы 211 Удаление Индексов 212 Изменение Однажды Созданной Таблицы 212 Удаление Таблиц 214 Резюме 214 Работа с SQL 215 ГЛАВА 18: ОГРАНИЧЕНИЕ ЗНАЧЕНИЙ ВАШИХ ДАННЫХ Ограничение Таблиц 218 Объявление Ограничений 218 Использование Ограничений чтобы Исключать NULL 219 Убедитесь, Что Значения - Уникальны 220 Ограничение ПЕРВИЧНОГО КЛЮЧА 222 Проверка Значений Поля 224 Установить Значение Поля - ПО УМОЛЧАНИЮ 227 Резюме 229 Работа с SQL 231 ГЛАВА 19: ПОДДЕРЖАНИЕ ЦЕЛОСТНОСТИ ВАШИХ ДАННЫХ Внешний Ключ и Родительский Ключ 234 Внешние Ключи Мультистолбцов 235 Значение Внешнего Ключа и Родительского Ключа 235 Ограничение ВНЕШНЕГО КЛЮЧА 236 Как Обьявить Поле Внешним Ключом 236 ВНЕШНИЙ КЛЮЧ как Таблица Ограничений 238 ВНЕШНИЙ КЛЮЧ как Столбец Ограничений 239 Исключение Списков Столбцов Первичного Ключа 239 Как Справочная Целостность Ограничивает Значение Родительского Ключа 240 Первичный Ключ вместо Уникального Родительского Ключа 240 Ограничения Внешнего Ключа 241 Что Случится Когда Вы Выполните Команду Модификации 241 Причастные к Определениям Таблицы 242 Действия Ограничений 243 Внешние Ключи Которые Ссылаются Обратно к Своим Собственным Таблицам 246 Резюме 248 Работа с SQL 250 ГЛАВА 20: ВВЕДЕНИЕ: ПРЕДСТАВЛЕНИЕ Что Такое Представление? 252 Команда CREATE VIEW 252 Модифицирование Представления 254 Именование Столбцов 255 Комбинация Предикатов Представлений И Предикатов Запросов Основанных на Представлениях 256 Сгруппированные Представления 257 Представления и Объединения 258 Представления и Подзапросы 258 Что Не могут Делать Представления 260 Удаление Представлений 261 Резюме 262 Работа с SQL 263 ГЛАВА 21: ИЗМЕНЕНИЕ ЗНАЧЕНИЙ С ПОМОЩЬЮ ПРЕДСТАВЛЕНИЙ Модифицирование Представлений 266 Определить: Модифицируемо ли Представление 268 Представления МОДИФИЦИРУЕМЫЕ и ТОЛЬКО_ЧТЕНИЕ 269 Какие Представления Являются Модифицируемыми 270 Проверка Значений Помещенных в Представление 271 Предикаты и Исключенные Поля 272 Проверка Представлений Которые Базируются на Других Представлениях 274 Резюме 275 Работа с SQL 277 ГЛАВА 22: ОПРЕДЕЛЕНИЕ: КТО ЧТО МОЖЕТ ДЕЛАТЬ Пользователи 280 Регистрация 280 Предоставление Привилегий 281 Стандартные Привилегии 281 Команда GRANT 282 Использование Агрументов ALL и PUBLIC 285 Передача Прав с помощью GRANT OPTION 286 Отнять Привилегии Обратно 287 Использование Представлений Чтобы Фильтровать Привилегии 288 Другие Виды Привилегий 291 Типовые Привилегии Системы 292 Создание и Удаление Пользователей 293 Резюме 294 Работа с SQL 295 ГЛАВА 23: ГЛОБАЛЬНЫЕ АСПЕКТЫ SQL Переименование Таблиц 298 Переименование с Тем Же Именем 298 Одно Имя для Каждого 299 Удаление Синонимов 300 Как - База Данных Распределяет Пользователей? 300 Когда Изменения Становятся Постоянными? 302 Как SQL Общается со Многими Пользователями Сразу 304 Типы Блокировок 307 Другие Способы Блокировки Данных 308 Резюме 309 Работа с SQL 311 ГЛАВА 24: КАК ДАННЫЕ SQL ХРАНЯТСЯ В УПОРЯДОЧЕННОМ ВИДЕ Каталог Системы 314 Типичный Каталог Системы 315 Использование Представлений в Таблицах Каталога 317 Комментарий Содержания Каталога 319 Остальные Каталоги 322 SYSTEMINDEXES - Индексация в Базе Данных 322 SYSTEMUSERAUTH - Пользователи и Привилегии Системы в Базе Данных 323 SYSTEMTABAUTH - Привилегии Объекта Которые Не Являются Указаным Столбцом 324 SYSTEMCOLAUTH - Привилегии Объекта Которые Являются Указаным Столбцом 326 SYSTEMSYNONS - Синонимы для Таблиц Базе Данных 328 Другое Использование Каталогов 329 Резюме 330 Работа с SQL 332 ГЛАВА 25: ИСПОЛЬЗОВАНИЕ SQL С ДРУГИМИ ЯЗЫКАМИ ( ВЛОЖЕННЫЙ SQL ) Что Понимается под Вложением SQL 334 Почему Вкладывают SQL? 334 Как Делается Вложение SQL? 335 Использование Переменных Главного Языка с SQL 336 Объявление Переменных 339 Извлечение Значений в Переменных 339 Курсор 410 SQLCODE 343 Использование SQLCODE для Управления Циклами 345 Команда WHENEVER 345 Модифицирование Курсоров 346 Переменная INDICATOR 349 Использование Переменной INDICATOR для Эмулирования SQL NULL 351 Другие Использования Переменной INDICATOR 352 Резюме 353 Работа с SQL 356 ПРИЛОЖЕНИЕ A: ОТВЕТЫ НА УПРАЖНЕНИЯ 359 ПРИЛОЖЕНИЕ B: ТИПЫ ДАННЫХ SQL 381 ПРИЛОЖЕНИЕ C: НЕКОТОРЫЕ ОБЩИЕ НЕСТАНДАРТНЫЕ ОСОБЕННОСТИ SQL 387 ПРИЛОЖЕНИЕ D: СИНТАКСИС И КОМАНДА ССЫЛКИ 399 ПРИЛОЖЕНИЕ E: ТАБЛИЦЫ ИСПОЛЬЗУЕМЫЕ В ПРИМЕРАХ 419 ПРЕДИСЛОВИЕ ====================== "ПОНИМАНИЕ SQL" - это полный учебник по программированию на Структу- рированном Языке Запросов, написанный специально для тех кто будет ис- пользовать SQL в процессе работы. Даже если это ваш первый опыт с компьютерами или управлением баз данных, книга "ПОНИМАНИЕ SQL" очень быстро научит вас свободно работать с реальной SQL, использованию простых запросов, а также снабдит вас ясными понятиями об автоматизи- рованном управлении базой данных. Книга даст вам краткое, удобное в чтении введение в реляционные базы данных. Предоставит вам обучающие программы чтобы овладевая командами SQL шаг за шагом, помочь вам уз- нать, как извлекать и обрабатывать информацию содержащуюся в таблицах данных, т.е.: * выбирать информацию с которой вы хотите работать * добавлять, удалять, и модифицировать информацию в таблице данных * использовать и-или, верно / неверно, и другие условия для обнуления определенной информации * использовать специальные функции SQL для суммирования ваших данных. Книга покажет Вам как эффективно работать с многочислеными таблица- ми данных, используя улучшеную технику для запроса более чем одной таблицы одновременно, строить комплекс запросов и подзапросов, и ис- пользовать представления чтобы создавать базы данных и работать с ба- зами данных раздельно с многими таблицы. Научит создавать новые таблицы данных для пользовательских деловых прикладных программ. Вы исследуете принципы эффективного проектирова- ния базы данных, а также техники для обеспечения целостности данных и их защиты. Вы узнаете, как использовать SQL с другими языками в специальной главе SQL, для программистов. "ПОНИМАНИЕ SQL" - необходима и пригодна для любой реализации Струк- турированного Языка Запроса. Книга включает и краткий справочный стан- дарт SQL и руководство к общим нестандартным особенностям SQL. Об Авторе Мартин Грубер - свободный писатель, учитель и консультант из Сан Франциско. В дополнении к написанию и редактированию книг, руко- водств пользователей и документации; он работает в широком спектре интересов связаных с компьютерами и компьютерными базами данных. 1. ВВЕДЕНИЕ В РЕЛЯЦИОННУЮ БАЗУ ДАННЫХ ВВЕДЕНИЕ ============================== SQL ( ОБЫЧНО ПРОИЗНОСИМАЯ КАК "СЭКВЭЛ" ) символизирует собой Струк- турированный Язык Запросов. Это - язык который дает вам возможность создавать и работать в реляционных базах данных, которые являются на- борами связанной информации сохраняемой в таблицах. Мир баз данных становится все более и более единым, что привело к необходимости создания стандартного языка который мог бы использовать- ся чтобы функционировать в большом количестве различных видов компь- ютерных сред. Стандартный язык позволит пользователям знающим один на- бор команд, использовать их чтобы создавать, отыскивать, изменять, и передавать информацию независимо от того работают ли они на персональ- ном компьютере, сетевой рабочей станции, или на универсальной ЭВМ. В нашем все более и более взаимосвязанном компьютерном мире, пользо- ватель снабженый таким языком, имеет огромное преимущество в использо- вании и обобщении информации из ряда источников с помощью большого колличества способов. Элегантность и независимость от специфики компьютерных технологий, а также его поддержка лидерами промышленности в области технологии реля- ционных баз данных, сделало SQL, и вероятно в течение обозримого буду- щего оставит его, основным стандартным языком. По этой причине, любой кто хочет работать с базами данных 90-х годов должен знать SQL. Стандарт SQL определяется ANSI (Американским Национальным Институтом Стандартов) и в данное время также принимается ISO (МЕЖДУНАРОДНОЙ ОР- ГАНИЗАЦИЕЙ ПО СТАНДАРТИЗАЦИИ). Однако, большинство коммерческих прог- рамм баз данных расширяют SQL без уведомления ANSI, добавляя разные другие особенности в этот язык, которые, как они считают, будут весьма полезны. Иногда они несколько нарушают стандарт языка, хотя хорошие идеи имеют тенденцию развиваться и вскоре становиться стандартами "рынка" сами по себе в силу полезности своих качеств. В этой книге, мы будем, в основном, следовать стандарту ANSI, но одновременно иногда будет показывать и некоторые наиболее общие отклонения от его стандар- та. Вы должны проконсультироваться с документацией вашего пакета прог- рамм который вы будете использовать, чтобы знать где в нем этот стан- дарт видоизменен. ПРЕЖДЕ, ЧЕМ ВЫ СМОЖЕТЕ ИСПОЛЬЗОВАТЬ SQL, ВЫ должны понять что такое реляционные базы данных. В этой главе, мы это объяс- ним, и покажем насколько реляционные базы данных полезны. Мы не будем обсуждать SQL именно здесь, и если вы уже знаете эти понятия довольно хорошо, вы можете просто пропустить эту главу. В любом случае, вы должны рассмотреть три таблицы которые предоставляются и объясняются в конце главы; они станут основой наших примеров в этой книге. Вторая копия этих таблиц находится Приложении E, и мы рекомендуем скопировать их для удобства ссылки к ним. ЧТО ТАКОЕ - РЕЛЯЦИОННАЯ БАЗА ДАННЫХ? Реляционная база данных - это тело связанной информации, сохраняемой в двумерных таблицах. Напоминает адресную или телефонную книгу. В кни- ге имеется большое количество входов, каждый из которых соответствует определеной особенности. Для каждой такой особенности, может быть нес- колько независимых фрагментов данных, например имя, телефонный номер, и адрес. Предположим, что вы должны сформатировать эту адресную книгу в виде таблицы со строками и столбцами. Каждая строка ( называемая также записью ) будет соответствовать определенной особенности; каждый столбец будет содержать значение для каждого типа данных - имени, те- лефонного номера, и адреса представляемого в каждой строке. Адресная книга могла бы выглядеть следующим образом: Имя Телефон Адрес Gerry Farish ( 415)365-8775 127 Primrose Ave.,SF Celia Brock ( 707)874-3553 246 #3rd St.,Sonoma Yves Grillet ( 762)976-3665 778 Modernas,Barcelona То что вы получили является основой реляционной базы данных как и было определено в начале этого обсуждения - а именно, двумерной (стро- ка и столбец ) таблицей информации. Однако, реляционные базы данных редко состоят из одной таблицы. Такая таблица меньше чем файловая сис- тема. Создав несколько таблиц взаимосвязанной информации, вы сможете выполнить более сложные и мощные операции с вашими данными. Мощность базы данных зависит от связи которую вы можете создать между фрагмен- тами информации, а не от самого фрагмента информации. СВЯЗЫВАНИЕ ОДНОЙ ТАБЛИЦЫ С ДРУГОЙ Позвольте нам использовать пример нашей адресной книги чтобы начать обсуждение базы данных которая может реально использоваться в деловой ситуации. Предположим, что персонажи в нашей первой таблице ( адресной книги ) - это пациенты больницы. В другой таблице, мы могли бы запом- нить дополнительную информацию об этих пациентах. Столбцы второй таб- лицы могли бы быть помечены как Пациент, Доктор, Страховка, и Балланс. Пациент Доктор Страховка Балланс Farish Drume B.C./B.S. $272.99 Grillet Halben None $44. 76 Brock Halben Health,Inc. $9077.47 Много мощных функций можно выполнить извлекая информацию из этих таблиц согласно указанным параметрам, особенно когда эти параметры включают в себя фрагменты информации свзанные в различных таблицах друг с другом. Например, возьмем - докторов. Предположим доктор Halben захотел получить номера телефонов всех своих пациентов. Чтобы извлечь эту информацию, он мог бы связать таблицу с номерами телефонов пациен- тов ( по адресной книге ) с таблицей которая бы указывала, какой из пациентов - его. Хотя, в этом простом примере, он мог бы держать это в голове и сразу получать номера телефонов пациентов Grillet и Brock, эти таблицы могут быть слишком большими и слишком сложными. Программы реляционной базы данных разрабатывались для того чтобы обрабатывать большие и сложные совокупности данных такого типа, что очевидно явля- ется более универсальным методом в деловом мире. Даже если бы база данных больницы содержала сотни или тысячи имен - как это вероятно и бывает на практике - одна команда SQL могла бы выдать доктору Halben информацию в которой он нуждался почти немедленно. ПОРЯДОК СТРОК ПРОИЗВОЛЕН Чтобы поддерживать максимальную гибкость, строки таблицы, по опреде- лению, не должны находиться ни в каком определенном порядке. С этой точки зрения, в этом структура базы данных отличается от нашей адрес- ной книги. Вход в адресную книгу обычно упорядочивается в алфавитном порядке. В системах с реляционной базой данных, имеется одна мощная возможность для пользоватей - это способность упорядочивать информацию так чтобы они могли восстанавливать ее. Рассмотрим вторую таблицу. Иногда Вам необходимо видеть эту информа- цию упорядоченной в алфавитном порядке по именам, иногда в возрастаю- щем или убывающем порядке, а иногда сгруппированной по отношению к ка- кому-нибудь доктору. Наложение порядка набора в строках будет сталки- ваться со способностью заказчика изменять его, поэтому строки всегда рассматриваются как неупорядоченные. По этой причине, вы не можете просто сказать:" Мы хотим посмотреть пятую строку таблицы. " Пренебре- гая порядком в котором данные вводились или любым другим критерием, мы определим, не ту строку, хотя она и будет пятой. Строки таблицы кото- рые рассматриваются, не будут в какой-либо определенной последователь- ности. ИДЕНТИФИКАЦИЯ СТРОК ( ПЕРВИЧНЫЕ КЛЮЧИ ) По этим и другим причинам, вы должны иметь столбец в вашей таблице который бы уникально идентифицировал каждую строку. Обычно, этот стол- бец содержит номер - например, номер пациента назначаемый каждому па- циенту. Конечно, вы могли бы использовать имя пациентов, но возможно что имеется несколько Mary Smiths; и в этом случае, вы не будете иметь другого способа чтобы отличить этих пациентов друг от друга. Вот почему номера так необходимы. Такой уникальный столбец( или уни- кальная группа столбцов ), используемый чтобы идентифицировать каждую строку и храненить все строки отдельно, называются - первичными ключа- ми таблицы. Первичные ключи таблицы важный элемент в структуре базы данных. Они - основа вашей системы записи в файл; и когда вы хотите найти опреде- ленную строку в таблице, вы ссылаетесь к этому первичному ключу. Кроме того, первичные ключи гарантируют, что ваши данные имеют определенную целостность. Если первичный ключ правильно используется и поддержива- ется, вы будете знать что нет пустых строк таблицы и что каждая строка отличается от любой другой строки. Мы будем обсуждать ключи и далее когда поговорим относительно справочной целостности в Главе 19. СТОЛБЦЫ ИМЕНУЮТСЯ И НУМЕРУЮТСЯ В отличие от строк, столбцы таблицы ( также называемые полями ) упоря- дочиваются и именуются. Таким образом, в нашей таблице адресной книги, возможно указать на " адрес столбца " или на " столбец 3 ". Конечно, это означает что каждый столбец данной таблицы должен иметь уникальное имя чтобы избежать неоднозначности. Лучше всего если эти имена указы- вают на содержание поля. В типовых таблицах этой книги, мы будем ис- пользовать такие сокращения для имени столбца, как cname для имени за- казчика, и odate для даты порядка. Мы также дадим каждой таблице лич- ный числовой номер столбца в качестве первичного ключа. Следующий раз- дел будет объяснять эти таблицы и их ключи более подробно. ========= ТИПОВАЯ БАЗА ДАННЫХ ========== Таблицы 1.1, 1.2, и 1.3 составляют реляционную базу данных которая является минимально достаточной чтобы легко ее отслеживать, и доста- точно полной, чтобы иллюстрировать главные понятия и практику исполь- зования SQL. Эти таблицы напечатаны в этой главе а также в Приложении E. Так как они будут использоваться для иллюстрирования различных особенностей SQL по всей этой книге, мы рекомендуем чтобы вы скопировали их, для удобства ссылки к ним. Вы могли уже обратить внимание что первый столбец каждой таблицы со- держит номера чьи значения различны для каждой строки. Как вы наверное и предположили, это - первичные ключи таблиц. Некоторые из этих номе- ров также показаны в столбцах других таблиц. В этом нет ничего невер- ного. Они поазывают связь между строками которые используют значение принимаемое из первичного ключа, и строками где это значение использу- ется в самом первичном ключе. Таблица 1.1: Продавцы ----------------------------------------------------------- SNUM SNAME CITY COMM ----------------------------------------------------------- 1001 Peel London .12 1002 Serres San Jose .13 1004 Motika London .11 1007 Rifkin Barcelona .15 1003 Axelrod New York .10 ----------------------------------------------------------- Таблица 1.2: Заказчики ---------------------------------------------- CNUM | CNAME | CITY | RATING | SNUM -------|------------|---------|--------|------ 2001 | Hoffman | London | 100 | 1001 2002 | Giovanni | Rome | 200 | 1003 2003 | Liu | SanJose | 200 | 1002 2004 | Grass | Berlin | 300 | 1002 2006 | Clemens | London | 100 | 1001 2008 | Cisneros | SanJose | 300 | 1007 2007 | Pereira | Rome | 100 | 1004 ---------------------------------------------- Таблица 1.3: Порядки ----------------------------------------------- ONUM | AMT | ODATE | CNUM | SNUM -------|-----------|-------------|------|------ 3001 | 18.69 | 10/03/1990 | 2008 | 1007 3003 | 767.19 | 10/03/1990 | 2001 | 1001 3002 | 1900.10 | 10/03/1990 | 2007 | 1004 3005 | 5160.45 | 10/03/1990 | 2003 | 1002 3006 | 1098.16 | 10/03/1990 | 2008 | 1007 3009 | 1713.23 | 10/04/1990 | 2002 | 1003 3007 | 75.75 | 10/04/1990 | 2004 | 1002 3008 | 4723.00 | 10/05/1990 | 2006 | 1001 3010 | 1309.95 | 10/06/1990 | 2004 | 1002 3011 | 9891.88 | 10/06/1990 | 2006 | 1001 ----------------------------------------------- Например, поле snum в таблице Заказчиков указывает, какому продавцу назначен данный заказчик. Номер поля snum связан с таблицей Продавцов, которая дает информацию об этих продавцах. Очевидно, что продавец ко- торому назначены заказчики должен уже существовать - то есть, значение snum из таблицы Заказчиков должно также быть представлено в таблице Продавцов. Если это так, то говорят, что " система находится в состоя- нии справочной целостности ". Этот вывод будет более полно и формально объяснен в Главе 19. ПРИМЕЧАНИЕ: Эти три представленых таблицы в тексте имеют русские имена - Продавцов, Заказчиков и Порядков, и далее будут упоминаться именно под этими именами. Имена любых других применяемых в книге таб- лиц будут написаны по английски что бы отличать их от наших базовых таблиц этой базы данных. Кроме того в целях однозначности, имена за- казчиков, продавцов, Системных Каталогов а также полей в тексте, также будут даны на латыни. Таблицы приведены как пример к похожей ситуации в реальной жизни, когда вы будете использовать SQL чтобы следить за продавцами, их за- казчиками, и порядками заказчиков. Давайте рассмотрим эти три таблицы и значения их полей. Здесь показаны столбцы Таблицы 1.1 ПОЛЕ СОДЕРЖАНИЕ --------- ---------------------------------------------- snum уникальный номер назначенный каждому продавцу ( " номер служащего " ). sname имя продавца. city расположение продавца( город ). comm комиссионные продавцов в десятичной форме. Таблица 1.2 содержит следующие столбцы: ПОЛЕ СОДЕРЖАНИЕ -------- --------------------------------------------------- cnum уникальный номер назначенный каждому заказчику. cname имя заказчика. city расположение заказчика( город ). rating код указывающего уровень предпочтения данного заказчика перед другими. Более высокий номер указывают на большее предпочтение( рейтинг ). snum номер продавца назначенного этому заказчику ( из таблицы Продавцов ) И имеются столбцы в Таблице 1.3: ПОЛЕ СОДЕРЖАНИЕ --------- --------------------------------------------------- onum уникальный номер данный каждому приобретению. amt значение суммы приобретений. odate дата приобретения. cnum номер заказчика делающего приобретение ( из таблицы Заказчиков ). snum номер продавца продающего приобретение ( из таблицы Продавцов). =========== РЕЗЮМЕ ============ Теперь вы знаете что такое реляционная база данных, понятие, которое звучит сложнее чем есть на самом деле. Вы также изучили некоторые фун- даментальные принципы относительно того, как сделаны таблицы - как ра- ботают строки и столбцы, как первичные ключи отличают строки друга друга, и как столбцы могут ссылаться к значениям в других столбцах. Вы поняли что запись это синоним строки, и что поле это синоним столбца. Оба термина встречаются в обсуждении SQL, и мы будем исполь- зовать их в равной степени в этой книге. Вы теперь знакомы с таблицами примеров. Краткие и простые , они спо- собны показать большинство особенностей языка, как вы это увидите В некоторых случаях, мы будем использовать другие таблицы или постулаты некоторых различных данных в одной из этих таблиц чтобы показать вам некоторые другие возможности. Теперь вы готовы к углублению в SQL самостоятельно. Следующая глава даст вам быстрый просмотр языка, и даст вам информацию, которая помо- жет Вам ссылаться к уже пройденным местам. ************** РАБОТА С SQL ************** 1. Какое поле таблицы Заказчиков является первичным ключом ? 2. Что является столбцом 4 из таблицы Заказчиков ? 3. Как по другому называется строка? Столбец? 4. Почему вы может не запрашивать для просмотра первые пять строк таблицы? ( См. Приложение A для ответов. ) . 2. SQL : ОБЗОР. ЭТА ГЛАВА ПОЗАКОМИТ ВАС СО СТРУКТУРОЙ SQL языка а также с определен- ными общими выводами, такими как тип данных которые эти поля могут со- держать и некоторые области неоднозначностей которые существуют в SQL. Она педназначена обеспечить связь с более конкретной информацией в последующих главах. Вы не должны запоминать каждую подробность упомя- нутую в этой главе. Краткий обзор представлен здесь в одной удобно размещеной области, многие подробности которой вы можете иметь чтобы в последствии ссылаться к ним по мере овладения языком. Мы поместили все это в начало книги чтобы ориентировать вас на мир SQL без упрощенного подхода к его проблемам и в тоже время дать Вам привычные в будущем места для ссылки к ним когда у Вас появятся вопросы. Этот материал мо- жет стать более понятным когда мы перейдем к описанию конкретных ко- манд SQL, начинающихся с Главы 3. ========= КАК РАБОТАЕТ SQL? ========== SQL это язык ориентированный специально на реляционные базы данных. Он устраняет много работы которую вы должны были бы сделать если бы вы использовали универсальный язык программирования, напрмер C. Чтобы сформировать реляционную базу данных на C, вам необходимо было бы на- чать с самого начала. Вы должны были бы определить объект - называемый таблицей которая могла бы расти чтобы иметь любое число строк, а затем создавать постепенно процедуры для помещения значений в нее и извлече- ния из них. Если бы вы захотели найти некоторые определенные строки, вам необходимо было бы выполнить по шагам процедуру, подобную следую- щей : 1. Рассмотрите строку таблицы. 2. Выполните проверку - является ли эта строка одной из строк кото- рая вам нужна. 3. Если это так, сохраните ее где-нибудь пока вся таблица не будет проверена. 4. Проверьте имеются ли другие строки в таблице. 5. Если имеются, возвратитесь на шаг 1. 6. Если строк больше нет, вывести все значения сохраненные в шаге 3. ( Конечно, это не фактический набор C команд, а только логика шагов которые должны были бы быть включены в реальную программу. ) SQL сэко- номит вам все это. Команды в SQL могут работать со всеми группами таб- лиц как с единым объектом и могут обрабатывать любое количество инфор- мации извлеченной или полученной из их, в виде единого модуля. ЧТО ДЕЛАЕТ ANSI ? Как мы уже рассказывали в Введении, стандарт SQL определяется с по- мощью кода ANSI (Американский Национальный Институт Стандартов ). SQL не изобретался ANSI. Это по существу изобретение IBM. Но другие компа- нии подхватили SQL сразу же, по крайней мере одна компания (Oracle) отбила у IBM право на рыночную продажу SQL продуктов. После того как появился ряд конкурирующих программ SQL на рынке, AN- SI определил стандарт к которому они должны быть приведены (определе- ние таких стандартов и является функцией ANSI ). Однако после этого, появились некоторые проблемы. Возникли они в ре- зультате стандартизации ANSI ввиде некоторых ограничений. Так как не всегда ANSI определяет то что является наиболее полезным, то программы пытаются соответствовать стандарту ANSI не позволяя ему ограничивать их слишком сильно. Это, в свою очередь, ведет к случайным несогласо- ванностям. Программы Баз Данных обычно дают ANSI SQL дополнительные особенности и часто ослабляют многие ограничения из большинства из них. Следовательно, общие разновидности ANSI будут также рассмотрены. Хо- тя мы очевидно не сможем объять каждое исключение или разновидность, удачные идеи имеют тенденцию к внедрению и использованию в различных программах даже когда они не определены стандартом ANSI. ANSI - это вид минимального стандарта и вы можете делать больше чем он позволяет, хотя и должны выполнять его указания при выполнении за- дач которые он определяет. ИНТЕРАКТИВНЫЙ И ВЛОЖЕННЫЙ SQL Имеются два SQL: Интерактивный и Вложенный. Большей частью, обе фор- мы работают одинаково, но используются различно. Интерактивный SQL ис- пользуется для функционирования непосредственно в базе данных чтобы производить вывод для использования его заказчиком. В этой форме SQL, когда вы введете команду, она сейчас же выполнится и вы сможете уви- деть вывод (если он вообще получится) - немедленно. Вложенный SQL состоит из команд SQL помещенных внутри программ, ко- торые обычно написаны на некотором другом языке (типа КОБОЛА или Пас- каля). Это делает эти программы более мощными и эффективным. Однако, допус- кая эти языки, приходится иметь дело с структурой SQL и стилем управ- ления данных который требует некоторых расширений к интерактивному SQL. Передача SQL команд во вложенный SQL является выдаваемой ("passed off") для переменных или параметров используемых программой в которую они были вложены. В этой книге, мы будем представлять SQL в интерактивной форме. Это даст нам возможность обсуждать команды и их эффекты не заботясь о том как они связаны с помощью интерфейса с другими языками. Интерактивный SQL - это форма наиболее полезная непрограммистам. Все что вы узнаете относительно интерактивного SQL в основном применимо и к вложенной форме. Изменения необходимые для использования вложенной формы будут использованы в последней главе этой книги. СУБПОДРАЗДЕЛЕНИЯ SQL И в интерактивной и во вложенной формах SQL, имеются многочисленные части, или субподразделения. Так как вы вероятно сталкнетесь с этой терминологией при чтении SQL, мы дадим некоторые пояснения. К сожалению, эти термины не используются повсеместно во всех реали- зациях. Они подчеркиваются ANSI и полезны на концептуальном уровне, но большинство SQL программ практически не обрабатывают их отдельно, так что они по существу становятся функциональными категориями команд SQL. DDL ( Язык Определения Данных ) - так называемый Язык Описания Схемы в ANSI, состоит из команд которые создают объекты ( таблицы, индексы, просмотры, и так далее ) в базе данных. DML (Язык Манипулирования Данными) - это набор команд которые опре- деляют какие значения представлены в таблицах в любой момент времени. DCD (Язык Управления Данными) состоит из средств которые определяют, разрешить ли пользователю выполнять определенные действия или нет. Они являются составными частями DDL в ANSI. Не забывайте эти имена. Это не различные языки, а разделы команд SQL сгруппированных по их функциям. ======== РАЗЛИЧНЫЕ ТИПЫ ДАННЫХ ======== Не все типы значений которые могут занимать поля таблицы - логически одинаковые. Наиболее очевидное различие - между числами и текстом. Вы не можете помещать числа в алфавитном порядке или вычитать одно имя из другого. Так как системы с реляционной базой данных базируются на свя- зях между фрагментами информации, различные типы данных должны понятно отличаться друга от друга, так чтобы соответствующие процессы и срав- нения. могли быть в них выполнены. В SQL, это делается с помощью назначения каждому полю - типа данных который укаазывает на тип значения которое это поле может содержать. Все значения в данном поле должны иметь одинаковый тип. В таблице За- казчиков, например, cname и city - содержат строки текста для оценки, snum, и cnum - это уже номера. По этой причине, вы не можете ввести значение Highest(Наивысший) или значение None(Никакой) в поле rating, которое имеет числовой тип данных. Это ограничение удачно, так как оно налагает некоторую структурность на ваши данные. Вы часто будете срав- нивать некоторые или все значения в данном поле, поэтому вы можете вы- полнять действие только на определенных строках а не на всех. Вы не могли бы сделать этого если бы значения полей имели смешанный тип дан- ных. К сожалению, определение этих типов данных является основной об- ластью в которой большинство коммерческих программ баз данных и офици- альный стандарт SQL, не всегда совпадают. ANSI SQL стандарт распознает только текст и тип номера, в то время как большинство коммерческих программ используют другие специальные типы. Такие как, DATA(ДАТА) и TIME(ВРЕМЯ) - фактически почти стандартные типы( хотя точный формат их меняется ). Некоторые пакеты также поддерживают такие типы, как напри- мер MONEY(ДЕНЬГИ) и BINARY (ДВОИЧНЫЕ). (MONEY - это специальная систе- ма исчисления используемая компьютерами. Вся информация в компьютере передается двоичными числами и затем преобразовываются в другие систе- мы, что бы мы могли легко использовать их и понимать.) ANSI определяет несколько различных типов значений чисел, различия между которыми - довольно тонки и иногда их путают. Разрешенные ANSI типы данных перечислены в Приложении B. Сложность числовых типов ANSI можно, по крайней мере частично,объяс- нить усилием сделать вложенный SQL, совместимым с рядом других языков. Два типа чисел ANSI , INTEGER(ЦЕЛОЕ ЧИСЛО) и DECIMAL (ДЕСЯТИЧНОЕ ЧИСЛО) ( которые можно сокращать как INT и DEC, соответственно ), бу- дут адекватны для наших целей, также как и для целей большинства прак- тических деловых прикладных программ. Естественно, что тип ЦЕЛОЕ можно представить как ДЕСЯТИЧНОЕ ЧИСЛО которое не содержит никаких цифр справа от десятичной точки. Тип для текста - CHAR ( или СИМВОЛ ), который относится к строке текста. Поле типа CHAR имеет определенную длину, которая определяется максимальным числом символов которые могут быть введены в это поле. Больше всего реализаций также имеют нестандартный тип называемый VARC- HAR(ПЕРЕМЕННОЕ ЧИСЛО СИМВОЛОВ), который является текстовой строкой ко- торая может иметь любую длину до определенного реализацией максимума (обычно 254 символа ). CHARACTER и VARCHAR значения включаются в оди- ночные кавычки как "текст". Различие между CHAR и VARCHAR в том, что CHAR должен резервировать достаточное количество памяти для максималь- ной длины строки, а VARCHAR распределяет память так как это необходи- мо. Символьные типы состоят из всех печатных символов, включая числа. Однако, номер 1 не то же что символ "1". Символ "1" - только другой печатный фрагмент текста, не определяемый системой как наличие число- вого значения 1. Например 1 + 1 = 2, но "1" + "1" не равняется "2". Символьные значения сохраняются в компьютере как двоичные значения, но показываются пользователю как печатный текст. Преобразование следует за форматом определяемым системой которую вы используете. Этот формат преобразования будет одним из двух стандартных типов (возможно с рас- ширениями) используемых в компьютерных системах: в ASCII коде ( ис- пользуемом во всех персональных и малых компьютерах ) и EBCDIC коде (Расширенном Двоично-Десятичном Коде Объмена Информации) (используемом в больших компьютерах). Определенные операции, такие как упорядочива- ние в алфавитном порядке значений поля, будет изменяться вместе с фор- матом. Применение этих двух форматов будет обсуждаться в Главе 4. Мы должны следить за рынком, а не ANSI, в использовании типа называ- емого DATE(ДАТОЙ). ( В системе, которая не распознает тип ДАТА, вы ко- нечно можете обьявить дату как символьное или числовое поле, но это сделает большинство операций более трудоемкими. ) Вы должны смотреть свою документацию по пакету программ которые вы будете использовать, чтобы выяснить точно, какие типы данных она поддерживает. SQL НЕСОГЛАСОВАННОСТИ Вы можете понять из предшествующего обсуждения, что имеются самосто- ятельные несогласованности внутри продуктов мира SQL. SQL появился из коммерческого мира баз данных как инструмент, и был позже превращен в стандарт ANSI. К сожалению, ANSI не всегда определяет наибольшую поль- зу, поэтому программы пытаются соответствовать стандарту ANSI не поз- воляя ему ограничивать их слишком сильно. ANSI - вид минимального стандарта - вы можете делать больше чем он это позволяет, но вы должны быть способны получить те же самые результаты что и при выполнении той же самой задачи. ЧТО ТАКОЕ - ПОЛЬЗОВАТЕЛЬ? SQL обычно находится в компьютерных системах которые имеют больше чем одного пользователя, и следовательно должны делать различие между ними ( ваше семейство PC может иметь любое число пользователей, но оно обычно не имеет способов чтобы отличвать одного от другого ). Обычно, в такой системе, каждый пользователь имеет некий вид кода проверки прав который идентифицирует его или ее (терминология изменяется ). В начале сеанса с компьютером, пользователь входит в систему (регистри- руется), сообщая компьютеру кто этот пользователь, идентифицированный с помощью определенного ID(Идентификатора). Любое колличество людей использующих тот же самый ID доступа, являются отдельными пользовате- лями; и аналогично, один человек может представлять большое количество пользователей ( в разное время ), используя различные доступные Иден- тификаторы. SQL следует этому примеру. Действия в большинстве сред SQL приведены к специальному доступному Идентификатору который точно соответствует определенному пользователю. Таблица или другой объект принадлежит пользователю, который имеет над ним полную власть. Пользователь может или не может иметь привилегии чтобы выполнять действие над объектом. Для наших целей, мы договоримся, что любой пользователь имеет привиле- гии необходимые чтобы выполнять любое действие, пока мы не возвратимся специально к обсуждению привилегий в Главе 22. Специальное значение - USER(ПОЛЬЗОВАТЕЛЬ) может использоваться как ар- гумент в команде. Оно указывает на доступный Идентификатор пользовате- ля, выдавшего команду. УСЛОВИЯ И ТЕРМИНОЛОГИЯ Ключевые слова - это слова которые имеют специальное значение в SQL. Они могут быть командами, но не текстом и не именами объектов. Мы бу- дем выделять ключевые слова печатая их ЗАГЛАВНЫМИ БУКВАМИ. Вы должны соблюдать осторожность чтобы не путать ключевые слова с терминами. SQL имеет определенные специальные термины которые используются что- бы описывать его. Среди них - такие слова как запрос, предложение, и предикат, которые являются важнейшими в описании и понимании языка но не означают что-нибудь самостоятельное для SQL. Команды, или предложения, являются инструкциями которыми Вы обращае- тесь к SQL базе данных. Команды состоят из одной или более отдельных логических частей называемых предложениями. Предложения начинаются ключевым словом для которого они являются проименованными, и состоят из ключевых слов и аргументов. Например предложения с которыми вы мо- жете сталкиваться - это " FROM Salespeope " и " WHERE city = "London". Аргументы завершают или изменяют значение предложения. В примерах вы- ше, Salespeople - аргумент, а FROM - ключевое слово предложения FROM. Аналогично, " city = "London" " - агрумент предложения WHERE. Объекты - структуры в базе данных которым даны имена и сохраняются в памяти. Они включают в себя базовые таблицы, представления (два типа таблиц), и индексы. Чтобы показать Вам как формируются команды, мы будем делать это на примерах. Имеется, однако, более формальный метод описания команд ис- пользующих стандартизированные условные обозначения. Мы будем исполь- зовать его в более поздних главах, для удобства чтобы понимать эти ус- ловные обозначения в случае если вы столкнетесь с ним в других SQL до- кументах. Квадратные скобки ( [ ] ) будут указывать части которые мо- гут неиспользоваться, а многоточия ( ... ) указывать что все предшест- вующее им может повторяться любое число раз. Слова обозначенные в уг- ловых скобках (<>) - специальные термины которые объясняют что они со- бой представляют. Мы упростили стандартную терминологию SQL значитель- но, но без ухудшения его понимания. ============== РЕЗЮМЕ ================ Мы быстро прошли основы в этой главе. Но нашим намерением и было - просто пролететь над основами SQL, так чтобы вы могли понять идею от- носительно всего объема. Когда мы возвратимся к основе в следующей главе, некоторые вещи станут более конкретными. Теперь вы знаете кое-что относительно SQL - какова его структура, как он используется, как он представляет данные, и как они определяются ( и некоторые не- согласованности появляющиеся при этом ), и некоторые условные обозна- чения и термины используемые чтобы описывать их. Все это - много ин- формации для одной главы; мы не ожидаем что бы вы запомнили все эти подробности, но вы сможете вернуться позже к ним если понадобится. По Главе 3, мы будем идти, показывая конкретно, как формируются команды и что они делают. Мы представим вам команду SQL используемую чтобы изв- лекать информацию из таблиц, и которая является наиболее широко ис- пользуемой командой в SQL. К концу этой главы, вы будете способны изв- лекать конкретную информацию из вашей базы данных с высокой степенью точности. ************** РАБОТА С SQL ************** 1. Какое наибольшее основное различие между типами данных в SQL ? 2. Распознает ANSI тип данных DATA ? 3. Какой подраздел SQL используется чтобы помещать значения в таблицы ? 4. Что такое - ключевое слово ? ( См. Приложение A для ответов. ) . 3. ИСПОЛЬЗОВАНИЕ SQL ДЛЯ ИЗВЛЕЧЕНИЯ ИНФОРМАЦИИ ИЗ ТАБЛИЦ. В ЭТОЙ ГЛАВЕ МЫ ПОКАЖЕМ ВАМ КАК ИЗВЛЕКАТЬ информацию из таблиц. Вы узнаете как опускать или переупорядочивать столбцы и как автоматически устранять избыточность данных из вашего вывода. В заключение, вы узна- ете как устанавливать условие( проверку ) которую вы можете использо- вать чтобы определить какие строки таблицы используются в выводе. Эта последняя особенность, будет далее описана в более поздних главах и является одной из наиболее изящных и мощных в SQL. ========= СОЗДАНИЕ ЗАПРОСА =========== Как мы подчеркивали ранее, SQL символизирует собой Структурированный Язык Запросов. Запросы - вероятно наиболее часто используемый аспект SQL. Фактически, для категории SQL пользователей, маловероятно чтобы кто-либо использовал этот язык для чего-то друго. По этой причине, мы будем начинать наше обсуждение SQL с обсуждения запроса и как он вы- полняется на этом языке. ЧТО ТАКОЕ ЗАПРОС ? Запрос - команда которую вы даете вашей программе базы данных, и ко- торая сообщает ей чтобы она вывела определенную информацию из таблиц в память. Эта информация обычно посылается непосредственно на экран компьютера или терминала которым вы пользуетесь, хотя, в большинстве случаев, ее можно также послать принтеру, сохранить в файле ( как объ- ект в памяти компьютера ), или представить как вводную информацию для другой команды или процесса. ГДЕ ПРИМЕНЯЮТСЯ ЗАПРОСЫ ? Запросы обычно рассматриваются как часть языка DML. Однако, так как запрос не меняет информацию в таблицах, а просто показывает ее пользо- вателю, мы будем рассматривать запросы как самостоятельную категорию среди команд DML которые производят действие, а не просто показывают содержание базы данных. Все запросы в SQL состоят из одиночной команды. Структура этой ко- манды обманчиво проста, потому что вы должны расширять ее так чтобы выполнить высоко сложные оценки и обработки данных. Эта команда назы- вается - SELECT(ВЫБОР). КОМАНДА SELECT В самой простой форме, команда SELECT просто инструктирует базу дан- ных чтобы извлечь информацию из таблицы. Например, вы могли бы вывести таблицу Продавцов напечатав следующее: SELECT snum, sname, sity, comm FROM Salespeople; Вывод для этого запроса показывается в Рисунке 3.1. =============== SQL Execution Log ============ | | | SELECT snum, sname, sity, comm | | FROM Salespeople; | | | | ==============================================| | snum sname city comm | | ------ ---------- ----------- ------- | | 1001 Peel London 0.12 | | 1002 Serres San Jose 0.13 | | 1004 Motika London 0.11 | | 1007 Rifkin Barcelona 0.15 | | 1003 Axelrod New York 0.10 | =============================================== Рисунок 3.1: команда SELECT Другими словами, эта команда просто выводит все данные из таблицы. Большинство программ будут также давать заголовки столбца как выше, а некоторые позволяют детальное форматирование вывода, но это уже вне стандартной спецификации. Имеется объяснение каждой части этой команды: SELECT Ключевое слово которое сообщает базе данных что эта команда - запрос. Все запросы начинаются этим словом, сопровождаемым пробелом. snum, sname Это - список столбцов из таблицы которые выбираются запросом. Любые столбцы не перечисленные здесь не будут включены в вывод команды. Это, конечно, не значит что они будут удалены или их информация будет стерта из таблиц, потому что запрос не воздействует на информацию в таблицах; он только показывает данные. FROM FROM - ключевое слово, подобно SELECT, которое должно Salespeople быть представлено в каждом запросе. Оно сопровожда- ется пробелом и затем именем таблицы используемой в качестве источника информации. В данном случае - это таблица Продавцов(Salespeople). ; Точка с запятой используется во всех интерактивных командах SQL чтобы сообщать базе данных что команда заполнена и готова выполниться. В некоторых системах наклонная черта влево (\) в строке, является индикатором конца команды. Естественно, запрос такого характера не обязательно будет упорядочи- вать вывод любым указаным способом. Та же самая команда выполненная с теми же самыми данными но в разное время не сможет вывести тот же са- мый порядок. Обычно, строки обнаруживаются в том порядке в котором они найдены в таблице, поскольку как мы установили в предыдущей главе - этот порядок произволен. Это не обязательно будет тот порядок в кото- ром данные вводились или сохранялись. Вы можете упорядочивать вывод командами SQL непосредственно: с помощью специального предложения. Позже, мы покажем как это делается. А сейчас, просто усвойте, что в отсутствии явного упорядочения, нет никакого определенного порядка в вашем выводе. Наше использование возврата ( Клавиша ENTER ) является произвольным. Мы должны точно установить как удобнее составить запрос, в несколько строк или в одну строку, следующим образом: SELECT snum, sname, city, comm FROM Salespeople; С тех пор как SQL использует точку с запятой чтобы указывать конец команды, большинство программ SQL обрабатывают возврат (через нажим Возврат или клавишу ENTER ) как пробел. Это - хорошая идея чтобы ис- пользовать возвраты и выравнивание что мы делали это ранее, чтобы сде- лать ваши команды более легкими для чтения и более правильными. ВЫБИРАЙТЕ ВСЕГДА САМЫЙ ПРОСТОЙ СПОСОБ Если вы хотите видеть каждый столбец таблицы, имеется необязательное сокращение которое вы можете использовать. Звездочка (*) может приме- няться для вывода полного списка столбцов следующим образом: SELECT * FROM Salespeople; Это привыведет к тому же результату что и наша предыдущая команда. ОПИСАНИЕ SELECT В общем случае, команда SELECT начинается с ключевого слова SELECT, сопровождаемого пробелом. После этого должен следовать список имен столбцов которые вы хотите видеть, отделяемые запятыми. Если вы хотите видеть все столбцы таблицы, вы можете заменить этот список звездочкой (*). Ключевое слово FROM следующее далее, сопровождается пробелом и именем таблицы запрос к которой делается. В заключение, точка с запя- той ( ; ) должна использоваться чтобы закончить запрос и указать что команда готова к выполнению. ПРОСМОТР ТОЛЬКО ОПРЕДЕЛЕННОГО СТОЛБЦА ТАБЛИЦЫ Команда SELECT способна извлечь строго определенную информацию из таблицы. Сначала, мы можем предоставить возможность увидеть только оп- ределенные столбцы таблицы. Это выполняется легко, простым исключением столбцов которые вы не хотите видеть, из части команды SELECT. Напри- мер, запрос SELECT sname, comm FROM Salespeople; будет производить вывод показанный на Рисунке 3.2. =============== SQL Execution Log ============ | | | SELECT snum, comm | | FROM Salespeople; | | | | ==============================================| | sname comm | | ------------- --------- | | Peel 0.12 | | Serres 0.13 | | Motika 0.11 | | Rifkin 0.15 | | Axelrod 0.10 | =============================================== Рисунок 3.2: Выбор определенных столбцов Могут иметься таблицы которые имеют большое количество столбцов со- держащих данные, не все из которых являются относящимися к поставленой задаче. Следовательно, вы можете найти способ подбора и выбора только полезных для Вас столбцов. ПЕРЕУПОРЯДОЧЕНИЕ СТОЛБЦА Даже если столбцы таблицы, по определению, упорядоченны, это не оз- начает что вы будете восстанавливать их в том же порядке. Конечно, звездочка (*) покажет все столбцы в их естественном порядке, но если вы укажете столбцы отдельно, вы можете получить их в том порядке кото- ром хотите. Давайте рассмотрим таблицу Порядков, содержащую дату при- обретения(odate), номер продавца(snum), номер порядка(onum), и суммы приобретения(amt): SELECT odate, snum, onum, amt FROM Orders; Вывод этого запроса показан на Рисунке 3.3. ============= SQL Execution Log =============== | | | SELECT odate, snum, onum, amt | | FROM Orders; | | | | ------------------------------------------------| | odate snum onum amt | | ----------- ------- ------ --------- | | 10/03/1990 1007 3001 18.69 | | 10/03/1990 1001 3003 767.19 | | 10/03/1990 1004 3002 1900.10 | | 10/03/1990 1002 3005 5160.45 | | 10/03/1990 1007 3006 1098.16 | | 10/04/1990 1003 3009 1713.23 | | 10/04/1990 1002 3007 75.75 | | 10/05/1990 1001 3008 4723.00 | | 10/06/1990 1002 3010 1309.95 | | 10/06/1990 1001 3011 9891.88 | | | =============================================== Рисунок 3.3: Реконструкция столбцов Как вы можете видеть, структура информации в таблицах - это просто основа для активной перестройки структуры в SQL. УДАЛЕНИЕ ИЗБЫТОЧНЫХ ДАННЫХ DISTINCT (ОТЛИЧИЕ) - аргумент который обеспечивает Вас способом уст- ранять двойные значения из вашего предложения SELECT. Предположим что вы хотите знать какие продавцы в настоящее время имеют свои порядки в таблице Порядков. Под порядком (здесь и далее) будет пониматься запись в таблицу Порядков, регистрирующую приобретения сделанные в определен- ный день определенным заказчиком у определенного продавца на опреде- ленную сумму). Вам не нужно знать, сколько порядков имеет каждый; вам нужен только список номеров продавцов (snum). Поэтому Вы можете ввес- ти: SELECT snum FROM Orders; для получения вывода показанного в Рисунке 3.4 =============== SQL Execution Log ============ | | | SELECT snum | | FROM Orders; | | | | ============================================= | | snum | | ------- | | 1007 | | 1001 | | 1004 | | 1002 | | 1007 | | 1003 | | 1002 | | 1001 | | 1002 | | 1001 | ============================================= Рисунок 3. 4: SELECT с дублированием номеров продавцов. Для получения списка без дубликатов, для удобочитаемости, вы можете ввести следующее: SELECT DISTINCT snum FROM Orders; Вывод для этого запроса показан в Рисунке 3.5. Другими словами, DISTINCT следит за тем, какие значения были ранее, так что бы они не были продублированы в списке. Это - полезный способ избежать избыточности данных, но важно что бы при этом вы понимали что вы делаете. Если вы не хотите потерять некоторые данные, вы не должны безоглядно использовать DISTINCT, потому что это может скрыть какую-то проблему или какие-то важные данные. Например, вы могли бы предполо- жить что имена всех ваших заказчиков различны. Если кто-то помещает второго Clemens в таблицу Заказчиков, а вы используете SELECT DISTINCT cname, вы не будете даже знать о существовании двойника. Вы можете по- лучить не того Clemens и даже не знать об этом. Так как вы не ожидаете избыточности, в этом случае вы не должны использовать DISTINCT. ПАРАМЕТРЫ DISTINCT DISTINCT может указываться только один раз в данном предложении SE- LECT. Если предложение выбирает многочисленные поля, =============== SQL Execution Log ============ | | | SELECT DISTINCT snum | | FROM Orders; | | | | ============================================= | | snum | | ------- | | 1001 | | 1002 | | 1003 | | 1004 | | 1007 | ============================================= Рисунок 3.5: SELECT без дублирования DISTINCT опускает строки где все выбранные поля идентичны. Строки в которых некоторые значения одинаковы а некоторые различны - будут сох- ранены. DISTINCT, фактически, приводит к показу всей строки вывода, не указывая полей ( за исключением когда он используется внутри агрегат- ных функций, как описано в Главе 6 ), так что нет никакого смысла что- бы его повторять. DISTINCT ВМЕСТО ALL Вместо DISTINCT, вы можете указать - ALL. Это будет иметь противопо- ложный эффект, дублирование строк вывода сохранится. Так как это - тот же самый случай когда вы не указываете ни DISTINCT ни ALL, то ALL - по существу скорее пояснительный, а не действующий аргумент. КВАЛИФИЦИРОВАННЫЙ ВЫБОР ПРИ ======= ИСПОЛЬЗОВАНИИ ПРЕДЛОЖЕНИЙ ======== Таблицы имеют тенденцию становиться очень большими, поскольку с те- чением времени, все большее и большее количество строк в нее добавля- ется. Поскольку обычно из них только определенные строки интересуют вас в данное время, SQL дает возможность вам устанавливать критерии чтобы определить какие строки будут выбраны для вывода. WHERE - предложение команды SELECT, которое позволяет вам устанавли- вать предикаты, условие которых может быть или верным или неверным для любой строки таблицы. Команда извлекает только те строки из таблицы для которой такое утверждение верно. Например, предположим вы хотите видеть имена и комиссионные всех продавцов в Лондоне. Вы можете ввести такую команду: SELECT sname, city FROM Salespeople; WHERE city = "LONDON"; Когда предложение WHERE представлено, программа базы данных просмат- ривает всю таблицу по одной строке и исследует каждую строку чтобы оп- ределить верно ли утверждение. Следовательно, для записи Peel, прог- рамма рассмотрит текущее значение столбца city, определит что оно рав- но "London", и включит эту строку в вывод. Запись для Serres не будет включена, и так далее. Вывод для вышеупомянутого запроса показан в Ри- сунке 3.6. =============== SQL Execution Log ============ | | | SELECT sname, city | | FROM Salespeople | | WHERE city = 'London' | | ============================================= | | sname city | | ------- ---------- | | Peel London | | Motika London | ============================================= Рисунок 3.6: SELECT c предложением WHERE Давайте попробуем пример с числовым полем в предложении WHERE. Поле rating таблицы Заказчиков предназначено чтобы разделять заказчиков на группы основанные на некоторых критериях которые могут быть получены в итоге через этот номер. Возможно это - форма оценки кредита или оценки основанной на томе предыдущих приобретений. Такие числовые коды могут быть полезны в реляционных базах данных как способ подведения итогов сложной информации. Мы можем выбрать всех заказчиков с рейтингом 100, следующим образом: SELECT * FROM Customers WHERE rating = 100; Одиночные кавычки не используются здесь потому, что оценка - это числовое поле. Результаты запроса показаны в Рисунке 3. 7. Предложение WHERE совместимо с предыдущим материалом в этой главе. Другими словами, вы можете использовать номера столбцов, устранять дубликаты, или переупорядочивать столбцы в команде SELECT которая ис- пользует WHERE. Однако, вы можете изменять порядок столбцов для имен только в предложении SELECT, но не в предложении WHERE. =============== SQL Execution Log ============ | | | SELECT * | | FROM Customers | | WHERE rating = 100; | | ============================================= | | сnum cname city rating snum | | ------ -------- ------ ---- ------ | | 2001 Hoffman London 100 1001 | | 2006 Clemens London 100 1001 | | 2007 Pereira Rome 100 1001 | ============================================= Рисунок 3.7: SELECT с числовым полем в предикате =============== РЕЗЮМЕ =============== Теперь вы знаете несколько способов заставить таблицу давать вам ту информацию какую вы хотите, а не просто выбрасывать наружу все ее со- держание. Вы можете переупорядочивать столбцы таблицы или устранять любую из них. Вы можете решать, хотите вы видеть дублированные значе- ния или нет. Наиболее важно то, что вы можете устанавливать условие называемое предикатом которое определяет или не определяет указанную строку таб- лицы из тысяч таких же строк, будет ли она выбрана для вывода. Предикаты могут становиться очень сложными, предоставляя вам высокую точность в решении, какие строки вам выбирать с помощью запроса. Имен- но эта способность решать точно, что вы хотите видеть, делает запросы SQL такими мощными. Следующие несколько глав будут посвещены, в боль- шей мере, особенностям которые расширяют мощность предикатов. В Главе 4, вам будут представлены операторы иные чем те которые используются в условиях предиката, а также способы объединения многочисленых условий в единый предикат. ************* РАБОТА С SQL *************** 1. Напишите команду SELECT которая бы вывела номер порядка, сумму, и дату для всех строк из таблицы Порядков. 2. Напишите запрос который вывел бы все строки из таблицы Заказчиков для которых номер продавца = 1001. 3. Напишите запрос который вывел бы таблицу со столбцами в следующем порядке: city, sname, snum, comm. 4. Напишите команду SELECT которая вывела бы оценку(rating), сопро- вождаемую именем каждого заказчика в San Jose. 5. Напишите запрос который вывел бы значения snum всех продавцов в текущем порядке из таблицы Порядков без каких бы то ни было пов- торений. ( См. Приложение A для ответов. ) . 4. ИСПОЛЬЗОВАНИЕ РЕЛЯЦИОННЫХ И БУЛЕВЫХ ОПЕРАТОРОВ ДЛЯ СОЗДАНИЯ БОЛЕЕ ИЗОЩРЕННЫХ ПРЕДИКАТОВ В ГЛАВЕ 3, ВЫ УЗНАЛИ ЧТО ПРЕДИКАТЫ МОГУТ оценивать равенство опера- тора как верного или неверного. Они могут также оценивать другие виды связей кроме равенств. Эта глава будет исследовать другие реляционные операторы используемые в SQL. Вы также узнаете как использовать опера- торы Буля, чтобы изменять и объединять значения предиката. С помощью операторов Буля (или проще говоря логических операторов), одиночный предикат может содержать любое число условий. Это позволяет вам созда- вать очень сложные предикаты. Использование круглых скобок в структуре этих сложных предикатов будет также объясняться. ========= РЕЛЯЦИОННЫЕ ОПЕРАТОРЫ ======= Реляционный оператор - математический символ который указывает на определенный тип сравнения между двумя значениями. Вы уже видели как используются равенства, такие как 2 + 3 = 5 или city = "London". Но также имеются другие реляционные операторы. Предположим что вы хотите видеть всех Продавцов с их комиссионными выше определенного значения. Вы можете использовать тип сравнения "больше чем" - (>). Реляционные операторы которыми распологает SQL : = Равный к > Больше чем < Меньше чем >= Больше чем или равно <= Меньше чем или равно <> Не равно Эти операторы имеют стандартные значения для числовых значений. Для значения символа, их определение зависит от формата преобразования, ASCII или EBCDIC, который вы используете. SQL сравнивает символьные значения в терминах основных номеров как определено в формате преобра- зования. Даже значение символа, такого как "1", который представляет номер, не обязательно равняется номеру который он представляет. Вы мо- жете использовать реляционные операторы чтобы установить алфавитный порядок - например, "a" < "n" где средство a первое в алфавитном по- рядке - но все это ограничивается с помощью параметра преобразования формата. И в ASCII и в EBCDIC, символы - по значению: меньше чем все другие символы которым они предшествуют в алфавитном порядке и имеют один ва- риант( верхний или нижний ). В ASCII, все символы верхнего регистра - меньше чем все символы нижнего регистра, поэтому "Z" < "a", а все но- мера - меньше чем все символы, поэтому "1" < "Z". То же относится и к EBCDIC. Чтобы сохранить обсуждение более простым, мы допустим что вы будете использовать текстовый формат ASCII. Проконсультируйтесь с ва- шей документацией системы если вы неуверены какой формат вы используе- те или как он работает. Значения сравниваемые здесь называются - скалярными значениями. Ска- лярные значения производяться скалярными выражениями; 1 + 2 - это ска- лярное выражение которое производит скалярное значение 3. Скалярное значение может быть символом или числом, хотя очевидно что только но- мера используются с арифметическими операторами, такими как +(плюс) или *(звезда). Предикаты обычно сравнивают значения скалярных величин, используя или реляционные операторы или специальные операторы SQL чтобы увидеть верно ли это сравнение. Некоторые операторы SQL описаны в Главе 5. Предположим что вы хотите увидеть всех заказчиков с оценкой(rating) выше 200. Так как 200 - это скалярное значение, как и значение в столбце оценки, для их сравнения вы можете использовать реляционный оператор. SELECT * FROM Customers WHERE rating > 200; Вывод для этого запроса показывается в Рисунке 4.1. Конечно, если бы мы захотели увидеть еще и заказчиков с оценкой рав- ной 200, мы стали бы использовать предикат rating > = 200 ========= БУЛЕВЫ ОПЕРАТОРЫ =========== Основные Булевы операторы также распознаются в SQL. Выражения Буля - являются или верными или неверными, подобно предикатам. Булевы опера- торы связывают одно или более верных/неверных значений и производят едиственное верное/или/неверное значение. Стандартными операторами Бу- ля распознаваемыми в SQL являются: AND, OR, и NOT. =============== SQL Execution Log ============ | | | SELECT * | | FROM Customers | | WHERE rating > 200; | | ============================================= | | snum cname city rating snum | | ----- -------- -------- ----- ------ | | 2004 Crass Berlin 300 1002 | | 2008 Cirneros San Jose 300 1007 | ============================================= Рисунок 4.1: Использование больше чем (>) Существуют другие, более сложные, операторы Буля ( типа " исключен- ный или " ), но они могут быть сформированы из этих трех простых опе- раторов - AND, OR, NOT. Как вы можете понять, Булева верня / неверная логика - основана на цифровой компьютерной операции; и фактически, весь SQL( или любой дру- гой язык ) может быть сведен до уровня Булевой логики. Операторы Буля и как они работают: * AND берет два Буля ( в форме A AND B) как аргументы и оценивает их по отношению к истине, верны ли они оба. * OR берет два Буля ( в форме A OR B) как аргументы и оценивает на правильность, верен ли один из них. * NOT берет одиночный Булев ( в форме NOT A) как аргументы и заменяет его значение с неверного на верное или верное на неверное. Связывая предикаты с операторами Буля, вы можете значительно увели- чить их возможности. Предположим вы хотите видеть всех заказчиков в San Jose которые имеют оценку(рейтинг) выше 200: SELECT * FROM Customers WHERE city = " San Jose' AND rating > 200; Вывод для этого запроса показан на Рисунке 4.2. Имеется только один заказчик который удовлетворяет этому условию. Если вы же используете OR вы получите всех заказчиков которые нахо- дились в San Jose или(OR) которые имели оценку выше 200. =============== SQL Execution Log ============ | | | SELECT * | | FROM Customers | | WHERE city = 'San Jose' | | AND rating > 200; | | ============================================= | | сnum cname city rating snum | | ------ -------- -------- ---- ----- | | 2008 Cirneros San Jose 300 1007 | ============================================= Рисунок 4.2: SELECT использующий AND SELECT * FROM Customers WHERE city = " San Jose' OR rating > 200; Вывод для этого запроса показывается в Рисунке 4.3. NOT может использоваться для инвертирования значений Буля. Имеется пример запроса с NOT: SELECT * FROM Customers WHERE city = " San Jose' OR NOT rating > 200; Вывод этого запроса показывается в Рисунке 4.4. =============== SQL Execution Log ============ | | | SELECT * | | FROM Customers | | WHERE city = 'San Jose' | | OR rating > 200; | | ============================================= | | сnum cname city rating snum | | ----- ------- -------- ----- ------ | | 2003 Liu San Jose 200 1002 | | 2004 Grass Berlin 300 1002 | | 2008 Cirneros San Jose 300 1007 | ============================================= Рисунок 4.:3: SELECT использующий OR =============== SQL Execution Log ============ | | | SELECT * | | FROM Customers | | WHERE city = 'San Jose' | | OR NOT rating > 200; | | ============================================= | | cnum cname city rating snum | | ------ -------- ------ ----- ----- | | 2001 Hoffman London 100 1001 | | 2002 Giovanni Rome 200 1003 | | 2003 Liu San Jose 200 1002 | | 2006 Clemens London 100 1001 | | 2008 Cirneros San Jose 300 1007 | | 2007 Pereira Rome 100 1004 | ============================================= Рисунок 4.4: SELECT использующий NOT Все записи за исключением Grass были выбраны. Grass не был в San Jo- se, и его оценка была больше чем 200, так что он потерпел неудачу при обеих проверках. В каждой из других строк встретился один или другой или оба критериев. Обратите внимание что оператор NOT должен предшест- вовать Булеву оператору, чье значение должно измениться, и не должен помещаться перед реляционным оператором. Например неправильным вводом оценки предиката будет: rating NOT > 200 Он выдаст другую отметку. А как SQL оценит следующее? SELECT * FROM Customers WHERE NOT city = " San Jose' OR rating > 200; NOT применяется здесь только к выражению city = 'SanJose', или к вы- ражению rating > 200 тоже ? Как и написано, правильный ответ будет прежним. SQL может применять NOT с выражением Буля только сразу после него. Вы можете получить другой результат при команде: SELECT * FROM Customers WHERE NOT( city = " San Jose' OR rating > 200 ); Здесь SQL понимает круглые скобки как означающие, что все внутри них будет оцениваться первым и обрабатываться как единое выражение с по- мощью всего что снаружи них ( это является стандартной интерпретацией в математике ). Другими словами, SQL берет каждую строку и определяет, соответствует ли истине равенство city = " San Jose' или равенство ra- ting > 200. Если любое условие верно, выражение Буля внутри круглых скобок верно. Однако, если выражение Буля внутри круглых скобок верно, предикат как единое целое неверен, потому что NOT преобразует верно в неверно и наоборот. Вывод для этого запроса - показывается в Рисунке 4.5. Имеется намеренно сложный пример. Посмотрим сможете ли вы проследить его логику (вывод показан в Рисунке 4.6 ): SELECT * FROM Orders WHERE NOT ((odate = 10/03/1990 AND snum >1002) OR amt > 2000.00); =============== SQL Execution Log ============ | | | SELECT * | | FROM Customers | | WHERE NOT (city = 'San Jose' | | OR rating > 200); | | ============================================= | | cnum cname city rating snum | | ----- -------- ------- ----- ------ | | 2001 Hoffman London 100 1001 | | 2002 Giovanni Rome 200 1003 | | 2006 Clemens London 100 1001 | | 2007 Pereira Rome 100 1004 | ============================================= Рисунок 4.5: SELECT использующий NOT и вводное предложение =============== SQL Execution Log ============== | | | SELECT * | | FROM Orders | | WHERE NOT ((odate = 10/03/1990 AND snum > 1002) | | OR amt > 2000.00); | | =============================================== | | onum amt odate cnum snum | | ------ -------- ---------- ----- ----- | | 3003 767.19 10/03/1990 2001 1001 | | 3009 1713.23 10/04/1990 2002 1003 | | 3007 75.75 10/04/1990 2004 1002 | | 3010 1309.95 10/06/1990 2004 1002 | ================================================= Рисунок 4.6: Полный (комплексный) запрос Несмотря на то что Булевы опреаторы индивидуально просты, они не так просты когда комбинируются в комплексное выражение. Способ оценки комплекса Булева состоит в том, чтобы оценивать Булевы выражения наиболее глубоко вложенные в круглых скобках, объединять их в единичное Булево значение, и затем объединять его с верхними значе- ниями. Имеется подробное объяснение того как пример выше был вычислен. Наи- более глубоко вложенные выражения Буля в предикате - это odate = 10/03/1990 и snum > 1002 являются объединеными с помощью AND, формируя одно выражение Буля которое будет оценено как верное для всех строк в которых встретились оба эти условия. Это составное Булево выражение (которое мы будем называть Булево номер 1, или B1 для краткости) объ- диняется с выражением (amt) > 2000.00 (B2) с помощью OR, формируя третье выражение (B3), которое является верным для данной строки, если или B1 или B2 - верны для этой строки. B3 полностью содержится в круглых скобках которым предшествует NOT, формируя последнее выражение Буля(B4), которое является условием пре- диката. Таким образом B4, предикат запроса, - будет верен всякий раз, когда B3 неправилен. B3 - неправилен всегда, когда B1 и B2 - оба неверны. B1 неправилен для строки если дата порядка строки не 10/03/1990, или если значение snum не большее чем 1002. B2 неправилен для всех строк, зна- чения суммы приобретений которых не превышает 2000.00. Любая строка со значением выше 2000.00 сделает B2 - верным; в результате B3 будет ве- рен, а B4 нет. Следовательно, все эти строки будут удалены из вывода. Из оставшихся, строки которые на 3 Октября имеют snum > 1002 ( такие как строки для onum 3001 на 3 Октября со snum = 1007 ), делают B1 вер- ным, с помощью верного B3 и неверного предиката запроса. Они будут также удалены из вывода. Вывод показан для строк которые оставлены. ================ РЕЗЮМЕ ================ В этой главе, вы значительно расширили ваше знакомство с предиката- ми. Теперь вы можете находить значения которые связаны с данным значе- нием любым способом - определяемым различными реляционными оператора- ми. Вы можете также использовать операторы Буля AND и OR чтобы много ус- ловий, каждое из которых автономно в предикатах, объединять в единый предикат. Оператор Буля NOT, как вы уже видели, может изменять значе- ние условия или группы условий на противоположное. Булевы и Реляционные операторы могут эффективно управляться с по- мощью круглых скобок, которые определяют порядок, в котором операции будут выполнены. Эти операции применимы к любому уровню сложности и вы поняли как сложные условия могут создаваться из этих простых частей. Теперь, когда мы показали как используются стандартные математичес- кие операторы, мы можем перейти к операторам которые являются исключи- тельными в SQL. Это мы сделаем в Главе 5. ************** РАБОТА С SQL ************** 1. Напишите запрос который может дать вам все порядки со значениями суммы выше чем $1,000. 2. Напишите запрос который может выдать вам поля sname и city для всех продавцов в Лондоне с комиссионными выше .10 . 3. Напишите запрос к таблице Заказчиков чей вывод может включить всех заказчиков с оценкой =< 100, если они не находятся в Риме. 4. Что может быть выведено в результате следующего запроса ? SELECT * FROM Orders WHERE (amt < 1000 OR NOT (odate = 10/03/1990 AND cnum > 2003 )); 5. Что может быть выведено в результате следующего запроса ? SELECT * FROM Orders WHERE NOT ((odate = 10/03/1990 OR snum > 1006) AND amt > = 1500 ); 6. Как можно проще переписать такой запрос ? SELECT snum, sname, city, comm FROM Salespeople WHERE ( comm > + .12 OR comm < .14 ); ( См. Приложение A для ответов. ) . 5. ИСПОЛЬЗОВАНИЕ СПЕЦИАЛЬНЫХ ОПЕРАТОРОВ В УСЛОВИЯХ. В ДОПОЛНЕНИИ К РЕЛЯЦИОННЫМ И БУЛЕВСКИМ операторам обсуждаемым в Гла- ве 4, SQL использует специальные операторы IN, BETWEEN, LIKE, и IS NULL. В этой главе, вы узнаете как их использовать и как реляционные операторы позволяют создавать более сложные и мощные предикаты. Обсуж- дение оператора IS NULL будет включать отсутствие данных и значение NULL, которое указывает на то: что данные отсутствуют. Вы также узнае- те о разновидностях использования оператора NOT применяющегося с этими операторами. ============ ОПЕРАТОР IN =============== Оператор IN определяет набор значений в которое данное значение мо- жет или не может быть включено. В соответствии с нашей учебной базой данных на которой вы обучаетесь по настоящее временя, если вы хотите найти всех продавцов, которые размещены в Barcelona или в London, вы должны использовать следующий запрос ( вывод показывается в Рисунке 5.1 ): SELECT * FROM Salespeople WHERE city = 'Barcelona' OR city = 'London'; Имеется и более простой способ получить ту же информацию: SELECT * FROM Salespeople WHERE city IN ( 'Barcelona', 'London' ); Вывод для этого запроса показывается в Рисунке 5.2. Как вы можете видеть, IN определяет набор значений с помощью имен членов набора заключеных в круглые скобки и отделенных запятыми. Он затем проверяет различные значения указанного поля пытаясь найти сов- падение со значениями из набора. Если это случается, то предикат ве- рен. Когда наборсодержит значения номеров а не символов, одиночные ка- вычки опускаются. Давайте найдем всех заказчиков относящихся к продав- цам имеющих значения snum = 1001, 1007, и 1004. Вывод для следующего запроса показан на Рисунке 5.3: SELECT * FROM Customers WHERE cnum IN ( 1001, 1007, 1004 ); =============== SQL Execution Log ============ | | | SELECT * | | FROM Salespeople | | WHERE city = 'Barcelona' | | OR city = 'London'; | | ==============================================| | snum sname city comm | | ------ ---------- ----------- ------- | | 1001 Peel London 0.12 | | 1004 Motika London 0.11 | | 1007 Rifkin Barcelona 0.15 | | | =============================================== Рисунок 5.1 Нахождение продавцов в Барселоне и Лондоне =============== SQL Execution Log ============ | | | SELECT * | | FROM Salespeople | | WHERE city IN ('Barcelona', 'London'; | | ==============================================| | snum sname city comm | | ------ ---------- ----------- ------- | | 1001 Peel London 0.12 | | 1004 Motika London 0.11 | | 1007 Rifkin Barcelona 0.15 | | | =============================================== Рисунок 5.2 SELECT использует IN =============== SQL Execution Log ============ | SELECT * | | FROM Customers | | WHERE snum IN ( 1001, 1007, 1004 ); | | ============================================= | | snum cname city rating snum | | ------ -------- ------ ---- ------ | | 2001 Hoffman London 100 1001 | | 2006 Clemens London 100 1001 | | 2008 Cisneros San Jose 300 1007 | | 2007 Pereira Rome 100 1004 | ============================================= Рисунок 5.3: SELECT использует IN с номерами =========== ОПЕРАТОР BETWEEN ========== Оператор BETWEEN похож на оператор IN. В отличии от определения по номерам из набора, как это делает IN, BETWEEN определяет диапазон, значения которого должны уменьшаться что делает предикат верным. Вы должны ввести ключевое слово BETWEEN с начальным значением, ключевое AND и конечное значение. В отличие от IN, BETWEEN чувствителен к по- рядку, и первое значение в предложении должно быть первым по алфавит- ному или числовому порядку. ( Обратите Внимание что, в отличие от Анг- лийского языка, SQL не говорит что "значение находится (между)BETWEEN значением и значением?, а просто "значение BETWEEN значение значение?. Это применимо и к оператору LIKE). Следующий пример будет извлекать из таблицы Продавцов всех продавцов с комиссионными между .10 и .12 (вы- вод показывается в Рисунке 5.4): SELECT * FROM Salespeople WHERE comm BETWEEN .10 AND .12; Для включенного оператора BETWEEN, значение совпадающее с любым из двух значений границы ( в этом случае, .10 и .12 ) заставляет предикат быть верным. =============== SQL Execution Log ============ | SELECT * | | FROM Salespeople | | WHERE comm BETWEEN .10 AND .12; | | ==============================================| | snum sname city comm | | ------ ---------- ----------- ------- | | 1001 Peel London 0.12 | | 1004 Motika London 0.11 | | 1003 Axelrod New York 0.10 | =============================================== Рисунок 5.4: SELECT использует BETWEEN SQL не делает непосредственной поддержки невключения BETWEEN. Вы должны или определить ваши граничные значения так, чтобы включающая интерпретация была приемлема, или сделать что-нибудь типа этого: SELECT * FROM Salespeople WHERE ( comm BETWEEN .10, AND .12 ) AND NOT comm IN ( .10, .12 ); Вывод для этого запроса показывается в Рисунке 5.5. По общему признанию, это немного неуклюже, но зато показывает как эти новые операторы могут комбинироваться с операторами Буля чтобы производить более сложные предикаты. В основном, вы используете IN и BETWEEN также как вы использовали реляционные операторы чтобы сравни- вать значения, которые берутся либо из набора ( для IN ) либо из диа- пазона ( для BETWEEN ). Также, подобно реляционным операторам, BETWEEN может работать с сим- вольными полями в терминах эквивалентов ASCII. Это означает что вы мо- жете использовать BETWEEN чтобы выбирать ряд значений из упорядоченных по алфавиту значений. =============== SQL Execution Log ============ | | | SELECT * | | FROM Salespeople | | WHERE ( comm BETWEEN .10 AND .12 | | AND NOT comm IN ( .10 .12; | | ==============================================| | snum sname city comm | | ------ ---------- ----------- ------- | | 1004 Motika London 0.11 | | | =============================================== Рисунок 5.5: Сделать BETWEEN - невключенным Этот запрос выбирает всех заказчиков чьи имена попали в определенный алфавитный диапазон: SELECT * FROM Customers WHERE cname BETWEEN 'A' AND 'G'; Вывод для этого запроса показывается в Рисунке 5.6. Обратите Внимание что Grass и Giovanni отсутствуют, даже при вклю- ченном BETWEEN. Это происходит из-за того что BETWEEN сравнивает стро- ки неравной длины. Строка 'G' более короткая чем строка Giovanni, поэ- тому BETWEEN выводит 'G' с пробелами. Пробелы предшествуют символам в алфавитном порядке ( в большинстве реализаций ), поэтому Giovanni не выбирается. То же самое происходит с Grass. Важно помнить это когда вы используете BETWEEN для извлечения значений из алфавитных диапазонов. Обычно вы указываете диапазон с помощью символа начала диапазона и символа конца( вместо которого можно просто поставить z ). =============== SQL Execution Log ============ | | | SELECT * | | FROM Customers | | WHERE cname BETWEEN 'A' AND 'G'; | | ============================================= | | cnum cname city rating snum | | ------ -------- ------ ---- ------ | | 2006 Clemens London 100 1001 | | 2008 Cisneros San Jose 300 1007 | | | ============================================= Рисунок 5. 6: Использование BETWEEN в алфавитных порядках ============ ОПЕРАТОР LIKE ============= LIKE применим только к полям типа CHAR или VARCHAR, с которыми он используется чтобы находить подстроки. Т.е. он ищет поле символа чтобы видеть, совпадает ли с условием часть его строки. В качестве условия он использует групповые символы(wildkards) - специальные символы кото- рые могут соответствовать чему-нибудь. Имеются два типа групповых символов используемых с LIKE: * символ подчеркивания ( _ ) замещает любой одиночный символ. Напри- мер, 'b_t' будет соответствовать словам 'bat' или 'bit', но не будет соответствовать 'brat'. * знак процента (%) замещает последовательность любого числа символов (включая символы нуля). Например '%p%t' будет соответствовать словам 'put', 'posit', или 'opt', но не 'spite'. Давайте найдем всех заказчиков чьи имена начинаются с G ( вывод показывается в Рисунке 5.7 ): SELECT FROM Customers WHERE cname LIKE 'G%'; =============== SQL Execution Log ============ | | | SELECT * | | FROM Customers | | WHERE cname LIKE 'G'; | | ============================================= | | cnum cname city rating snum | | ------ -------- ------ ---- ------ | | 2002 Giovanni Rome 200 1003 | | 2004 Grass Berlin 300 1002 | | | ============================================= Рисунок 5. 7: SELECT использует LIKE с % LIKE может быть удобен если вы ищете имя или другое значение, и если вы не помните как они точно пишутся. Предположим что вы неуверены как записано по буквам имя одного из ваших продавцов Peal или Peel. Вы мо- жете просто использовать ту часть которую вы знаете и групповые симво- лы чтобы находить все возможные пары ( вывод этого запроса показывает- ся в Рисунке 5.8 ): SELECT * FROM Salespeople WHERE sname LIKE 'P _ _ l %'; Групповые символы подчеркивания, каждый из которых представляет один символ, добавят только два символа к уже существующим 'P' и 'l' , поэ- тому имя наподобии Prettel не может быть показано. Групповой символ ' % ' - в конце строки необходим в большинстве реализаций если длина по- ля sname больше чем число символов в имени Peel ( потому что некоторые другие значения sname - длиннее чем четыре символа ). В таком случае, значение поля sname , фактически сохраняемое как имя Peel, сопровожда- ется рядом пробелов. Следовательно, символ 'l' не будет рассматривать- ся концом строки. Групповой символ ' % ' - просто соответствует этим пробелам. Это необязательно, если поля sname имеет тип - VARCHAR. =============== SQL Execution Log ============ | | | SELECT * | | FROM Salespeople | | WHERE sname LIKE ' P 1% '; | | ==============================================| | snum sname city comm | | ------ ---------- ----------- ------- | | 1001 Peel London 0.12 | | | =============================================== Рисунок 5.8: SELECT использует LIKE с подчеркиванием (_) А что же Вы будете делать если вам нужно искать знак процента или знак подчеркивания в строке? В LIKE предикате, вы можете определить любой одиночный символ как символ ESC. Символ ESC используется сразу перед процентом или подчеркиванием в предикате, и означает что процент или подчеркивание будет интерпретироваться как символ а не как группо- вой символ. Например, мы могли бы найти наш sname столбец где присутс- твует подчеркивание, следующим образом: SELECT * FROM Salespeople WHERE sname LIKE '%/_%'ESCAPE'/'; С этими данными не будет никакого вывода, потому что мы не включили никакого подчеркивания в имя нашего продавца. Предложение ESCAPE опре- деляет '/ ' как символ ESC. Символ ESC используемый в LIKE строке, сопровождается знаком процента, знаком подчеркивания, или знаком ESCA- PE, который будет искаться в столбце, а не обрабатываться как группо- вой символ. Символ ESC должен быть одиночным символом и применяться только к одиночному символу сразу после него. В примере выше, символ процента начала и символ процента окончания обрабатываются как групповые символы; только подчеркивание предостав- лено само себе. Как упомянуто выше, символ ESC может также использоваться самостоя- тельно. Другими словами, если вы будете искать столбец с вашим симво- лом ESC, вы просто вводите его дважды. Во-первых это будет означать что символ ESC "берет следующий символ буквально как символ", и во-вторых что символ ESC самостоятелен. Имеется предыдущий пример который пересмотрен чтобы искать местонахождение строки '_/' в sname столбце: SELECT * FROM Salespeople WHERE sname LIKE ' % /_ / / %'ESCAPE'/'; Снова не будет никакого вывода с такими данными. Строка сравнивается с содержанием любой последовательности символов (%), сопровождаемых символом подчеркивания ( /_ ), символом ESC ( // ), и любой последова- тельностью символов в конце строки ( % ). РАБОТА С НУЛЕВЫМИ( NULL ) ЗНАЧЕНИЯМИ Часто, будут иметься записи в таблице которые не имеют никаких зна- чений для каждого поля, например потому что информация не завершена, или потому что это поле просто не заполнялось. SQL учитывает такой ва- риант, позволяя вам вводить значение NULL(ПУСТОЙ) в поле, вместо зна- чения. Когда значение поля равно NULL, это означает, что программа ба- зы данных специально промаркировала это поле как не имеющее никакого значения для этой строки (или записи). Это отличается от просто назна- чения полю, значения нуля или пробела, которые база данных будет обра- батывать также как и любое другое значение. Точно также, как NULL не является техническим значением, оно не имеет и типа данных. Оно может помещаться в любой тип поля. Тем ни менее, NULL в SQL часто упоминает- ся как нуль. Предположим, что вы получили нового заказчика который еще не был назначен продавцу. Чем ждать продавца к которому его нужно назначить, вы можете ввести заказчика в базу данных теперь же, так что он не по- теряется при перестановке. Вы можете ввести строку для заказчика со значением NULL в поле snum и заполнить это поле значением позже, когда продавец будет назначен. ========== NULL ОПЕРАТОР ========= Так как NULL указывает на отсутствие значения, вы не можете знать каков будет результат любого сравнения с использованием NULL. Когда NULL сравнивается с любым значением, даже с другим таким же NULL, ре- зультат будет ни верным ни неверным, он - неизвестен. Неизвестный Бу- лев, вообще ведет себя также как неверная строка, которая произведя неизвестное значение в предикате не будет выбрана запросом - имейте ввиду что в то время как NOT(неверное) - равняется верно, NOT (неиз- вестное) - равняется неизвестно. Следовательно, выражение типа 'city = NULL' или 'city IN (NULL)' бу- дет неизвестно, независимо от значения city. Часто вы должны делать различия между неверно и неизвестно - между строками содержащими значения столбцов которые не соответствуют усло- вию предиката и которые содержат NULL в столбцах. По этой причине, SQL предоставляет специальный оператор IS, который используется с ключевым словом NULL, для размещения значения NULL. Найдем все записи в нашей таблице Заказчиков с NULL значениями в ci- ty столбце: SELECT * FROM Customers WHERE city IS NULL; Здесь не будет никакого вывода, потому что мы не имеем никаких зна- чений NULL в наших типовых таблицах. Значения NULL - очень важны, и мы вернемся к ним позже. ИСПОЛЬЗОВАНИЕ NOT СО СПЕЦИАЛЬНЫМИ ОПЕРАТОРАМИ Специальные операторы которые мы изучали в этой главе могут немед- ленно предшествовать Булеву NOT. Он противоположен реляционным операторам, которые должны иметь опе- ратор NOT - вводимым выражением. Например, если мы хотим устранить NULL из нашего вывода, мы будем использовать NOT чтобы изменить на противоположное значение предиката: SELECT * FROM Customers WHERE city NOT NULL; При отсутствии значений NULL( как в нашем случае ), будет выведена вся таблица Заказчиков. Аналогично можно ввести следующее SELECT * FROM Customers WHERE NOT city IS NULL; - что также приемлемо. Мы можем также использовать NOT с IN: SELECT * FROM Salespeople WHERE city NOT IN ( 'London', 'San Jose' ); А это - другой способ подобного же выражения SELECT * FROM Salespeople WHERE NOT city IN ( 'London', ' San Jose' ); Вывод для этого запроса показывается в Рисунке 5.9. Таким же способом Вы можете использовать NOT BETWEEN и NOT LIKE. =============== SQL Execution Log ============ | | | SELECT * | | FROM Salespeople | | WHERE sity NOT IN ('London', 'San Jose'; | | ==============================================| | snum sname city comm | | ------ ---------- ----------- ------- | | 1003 Rifkin Barcelona 0.15 | | 1007 Axelrod New York 0.10 | | | =============================================== Рисунок 5. 9: Использование NOT с IN =============== РЕЗЮМЕ ================ Теперь вы можете создавать предикаты в терминах связей специально определенных SQL. Вы можете искать значения в определенном диапазоне (BETWEEN) или в числовом наборе (IN), или вы можете искать символьные значения которые соответствуют тексту внутри параметров (LIKE). Вы также изучили некоторые вещи относительно того как SQL поступает при отсутствии данных - что реальность мировой базы данных - используя NULL вместо конкретных значений. Вы можете извлекать или исключать значения NULL из вашего вывода используя оператор IS NULL. Теперь, когда вы имеете в вашем распоряжении весь набор стандартных математи- ческих и специальных операторов, вы можете переходить к специальным функциям SQL которые работают на всех группах значений, а не просто на одиночном значении, что важно. Это уже тема Главы 6. ************** РАБОТА С SQL ************** 1. Напишите два запроса которые могли бы вывести все порядки на 3 или 4 Октября 1990 2. Напишите запрос который выберет всех заказчиков обслуживаемых про- давцами Peel или Motika. ( Подсказка: из наших типовых таблиц, поле snum связывает вторую таблицу с первой ) 3. Напишите запрос, который может вывести всех заказчиков чьи имена начинаются с буквы попадающей в диапазон от A до G. 4. Напишите запрос который выберет всех пользователей чьи имена начи- наются с буквы C. 5. Напишите запрос который выберет все порядки имеющие нулевые значе- ния или NULL в поле amt(сумма). ( См. Приложение A для ответов. ) . 6. ОБОБЩЕНИЕ ДАННЫХ С ПОМОЩЬЮ АГРЕГАТНЫХ ФУНКЦИЙ В ЭТОЙ ГЛАВЕ, ВЫ ПЕРЕЙДЕТЕ ОТ ПРОСТОГО использования запросов к изв- лечению значений из базы данных и определению, как вы можете использо- вать эти значения чтобы получить из них информацию. Это делается с по- мощью агрегатных или общих функций которые берут группы значений из поля и сводят их до одиночного значения. Вы узнаете как использовать эти функции, как определить группы значений к которым они будут приме- няться, и как определить какие группы выбираются для вывода. Вы будете также видеть при каких условиях вы сможете объединить значения поля с этой полученной информацией в одиночном запросе. ==== ЧТО ТАКОЕ АГРЕГАТНЫЕ ФУНКЦИИ ? ===== Запросы могут производить обобщенное групповое значение полей точно также как и значение одного поля. Это делает с помощью агрегатых функ- ций. Агрегатные функции производят одиночное значение для всей группы таблицы. Имеется список этих функций: * COUNT производит номера строк или не-NULL значения полей которые выбрал запрос. * SUM производит арифметическую сумму всех выбранных значений данного поля. * AVG производит усреднение всех выбранных значений данного поля. * MAX производит наибольшее из всех выбранных значений данного поля. * MIN производит наименьшее из всех выбранных значений данного поля. КАК ИСПОЛЬЗОВАТЬ АГРЕГАТНЫЕ ФУНКЦИИ ? Агрегатные функции используются подобно именам полей в предложении SELECT запроса, но с одним исключением, они берут имена поля как аргу- менты. Только числовые поля могут использоваться с SUM и AVG. С COUNT, MAX, и MIN, могут использоваться и числовые или символьные поля. Когда они используются с символьными полями, MAX и MIN будут транслировать их в эквивалент ASCII, который должен сообщать, что MIN будет означать первое, а MAX последнее значение в алфавитном порядке( выдача алфавит- ного упорядочения обсуждается более подробно в Главе 4 ). Чтобы найти SUM всех наших покупок в таблицы Порядков, мы можем ввести следующий запрос, с его выводом в Рисунке 6.1: SELECT SUM ((amt)) FROM Orders; =============== SQL Execution Log ============ | | | SELECT SUM (amt) | | FROM Orders; | | ==============================================| | | | ------- | | 26658.4 | | | | | =============================================== Рисунок 6.1: Выбор суммы Это конечно, отличается от выбора поля при котором возвращается оди- ночное значение, независимо от того сколько строк находится в таблице. Из-за этого, агрегатные функции и поля не могут выбираться одновремен- но, пока предложение GROUP BY (описанное далее) не будет использовано. Нахождение усредненой суммы - это похожая операция ( вывод следующего запроса показывается в Рисунке 6.2 ): SELECT AVG (amt) FROM Orders; =============== SQL Execution Log ============ | | | SELECT AVG (amt) | | FROM Orders; | | ==============================================| | | | ------- | | 2665.84 | | | | | =============================================== Рисунок 6.2: Выбор среднего СПЕЦИАЛЬНЫЕ АТРИБУТЫ COUNT Функция COUNT несколько отличается от всех. Она считает число значе- ний в данном столбце, или число строк в таблице. Когда она считает значения столбца, она используется с DISTINCT чтобы производить счет чисел различных значений в данном поле. Мы могли бы использовать ее, например, чтобы сосчитать номера продавцов в настоящее время описаных в таблице Порядков ( вывод показывается в Рисунке 6.3 ): SELECT COUNT ( DISTINCT snum ) FROM Orders; ИСПОЛЬЗОВАНИЕ DISTINCT Обратите внимание в вышеупомянутом примере, что DISTINCT, сопровож- даемый именем поля с которым он применяется, помещен в круглые скобки, но не сразу после SELECT, как раньше. Этого использования DISTINCT с COUNT применяемого к индивидуальным столбцам, требует стандарт ANSI, но большое количество программ не предъявляют к ним такого требования. =============== SQL Execution Log ============ | | | SELECT COUNT (DISTINCT snum) | | FROM Orders; | | ==============================================| | | | ------- | | 5 | | | | | =============================================== Рисунок 6.3: Подсчет значений поля Вы можете выбирать многочисленые счета( COUNT ) из полей с помощью DISTINCT в одиночном запросе который, как мы видели в Главе 3, не вы- полнялся когда вы выбирали строки с помощью DISTINCT. DISTINCT может использоваться таким образом, с любой функцией агрегата, но наиболее часто он используется с COUNT. С MAX и MIN, это просто не будет иметь никакого эффекта, а SUM и AVG, вы обычно применяете для включения пов- торяемых значений, так как они законно эффективнее общих и средних значений всех столбцов. ИСПОЛЬЗОВАНИЕ COUNT СО СТРОКАМИ, А НЕ ЗНАЧЕНИЯМИ Чтобы подсчитать общее число строк в таблице, используйте функцию COUNT со звездочкой вместо имени поля, как например в следующем приме- ре, вывод из которого показан на Рисунке 6.4: SELECT COUNT (*) FROM Customers COUNT со звездочкой включает и NULL и дубликаты, по этой причине DISTINCT не может быть использован. DISTINCT может производить более высокие номера чем COUNT особого поля, который удаляет все =============== SQL Execution Log ============ | | | SELECT COUNT (*) | | FROM Customers; | | ==============================================| | | | ------- | | 7 | | | | | =============================================== Рисунок 6. 4: Подсчет строк вместо значений строки, имеющие избыточные или NULL данные в этом поле. DISTINCT не применим c COUNT (*), потому, что он не имеет никакого действия в хорошо разработаной и поддерживаемой базе данных. В такой базе данных, не должно быть ни таких строк, которые бы являлись пол- ностью пустыми, ни дубликатов ( первые не содержат никаких данных, а последние полностью избыточны ). Если, с другой стороны, все таки име- ются полностью пустые или избыточные строки, вы вероятно не захотите чтобы COUNT скрыл от вас эту информацию. ВКЛЮЧЕНИЕ ДУБЛИКАТОВ В АГРЕГАТНЫЕ ФУНКЦИИ Агрегатные функции могут также ( в большинстве реализаций ) исполь- зовать аргумент ALL, который помещается перед именем поля, подобно DISTINCT, но означает противоположное: - включать дубликаты. ANSI тех- нически не позволяет этого для COUNT, но многие реализации ослабляют это ограничение. Различия между ALL и * когда они используются с COUNT - * ALL использует имя_поля как аргумент. * ALL не может подсчитать значения NULL. Пока * является единственым аргументом который включает NULL значе- ния, и он используется только с COUNT; функции отличные от COUNT игно- рируют значения NULL в любом случае. Следующая команда подсчитает(CO- UNT) число не-NULL значений в поле rating в таблице Заказчиков ( вклю- чая повторения ): SELECT COUNT ( ALL rating ) FROM Customers; АГРЕГАТЫ ПОСТРОЕННЫЕ НА СКАЛЯРНОМ ВЫРАЖЕНИИ До этого, вы использовали агрегатные функции с одиночными полями как аргументами. Вы можете также использовать агрегатные функции с аргу- ментами которые состоят из скалярных выражений включающих одно или бо- лее полей. ( Если вы это делаете, DISTINCT не разрешается. ) Предполо- жим, что таблица Порядков имеет еще один столбец который хранит преды- дущий неуплаченый баланс (поле blnc) для каждого заказчика. Вы должны найти этот текущий баланс, добавлением суммы приобретений к предыдуще- му балансу. Вы можете найти наибольший неуплаченый баланс следующим образом: SELECT MAX ( blnc + (amt) ) FROM Orders; Для каждой строки таблицы, этот запрос будет складывать blnc и amt для этого заказчика и выбирать самое большое значение которое он най- дет. Конечно, пока заказчики могут иметь многочисленые порядки, их не- уплаченый баланс оценивается отдельно для каждого порядка. Возможно, порядок с более поздней датой будет иметь самый большой неуплаченый баланс. Иначе, старый баланс должен быть выбран как в запросе выше. Фактически, имеются большое количество ситуаций в SQL где вы можете использовать скалярные выражения с полями или вместо полей, как вы увидете это в Главе 7. ПРЕДЛОЖЕНИЕ GROUP BY Предложение GROUP BY позволяет вам определять подмножество значений в особом поле в терминах другого поля, и применять функцию агрегата к подмножеству. Это дает вам возможность объединять поля и агрегатные функции в едином предложении SELECT. Например, предположим что вы хо- тите найти наибольшую сумму приобретений полученную каждым продавцом. Вы можете сделать раздельный запрос для каждого из них, выбрав MAX (amt) из таблицы Порядков для каждого значения поля snum. GROUP BY, однако, позволит Вам поместить их все в одну команду: SELECT snum, MAX (amt) FROM Orders GROUP BY snum; Вывод для этого запроса показывается в Рисунке 6.5. =============== SQL Execution Log ============== | | | SELECT snum, MAX (amt) | | FROM Orders | | GROUP BY snum; | | =============================================== | | snum | | ------ -------- | | 1001 767.19 | | 1002 1713.23 | | 1003 75.75 | | 1014 1309.95 | | 1007 1098.16 | | | ================================================ Рисунок 6.5: Нахождение максимальной суммы продажи у каждого продавца GROUP BY применяет агрегатные функции независимо от серий групп ко- торые определяются с помощью значения поля в целом. В этом случае, каждая группа состоит из всех строк с тем же самым значением поля snum, и MAX функция применяется отдельно для каждой такой группы. Это значение поля, к которому применяется GROUP BY, имеет, по определению, только одно значение на группу вывода, также как это делает агрегатная функция. Результатом является совместимость которая позволяет агрега- там и полям объединяться таким образом. Вы можете также использовать GROUP BY с многочислеными полями. Со- вершенствуя вышеупомянутый пример далее, предположим что вы хотите увидеть наибольшую сумму приобретений получаемую каждым продавцом каж- дый де