Buy this Reference Manual in softcover from Barnes & Noble!
Индексы применяются для быстрого поиска строк с указанным значением одного столбца. Без индекса чтение таблицы осуществляется по всей таблице начиная с первой записи, пока не будут найдены соответствующие строки. Чем больше таблица, тем больше накладные расходы. Если же таблица содержит индекс по рассматриваемым столбцам, то MySQL может быстро определить позицию для поиска в середине файла данных без просмотра всех данных. Для таблицы, содержащей 1000 строк, это будет как минимум в 100 раз быстрее по сравнению с последовательным перебором всех записей. Однако в случае, когда необходим доступ почти ко всем 1000 строкам, быстрее будет последовательное чтение, так как при этом не требуется операций поиска по диску.
Все индексы MySQL (PRIMARY
, UNIQUE
, и INDEX
) хранятся в виде B-деревьев. Строки автоматически сжимаются с удалением пробелов в префиксах и оконечных пробелов (see section 6.5.7 Синтаксис оператора CREATE INDEX
).
Индексы используются для того, чтобы:
WHERE
.MAX()
или MIN()
для заданного индексированного столбца. Эта операция оптимизируется препроцессором, который проверяет, не используете ли вы WHERE key_part_4 = константа
, по всем частям составного ключа < N
. В этом случае MySQL сделает один просмотр ключа и заменит выражение константой MIN()
. Если все выражения заменяются константой, запрос моментально вернет результат:
SELECT MIN(key_part2),MAX(key_part2) FROM table_name where key_part1=10
ORDER BY key_part_1,key_part_2
). Если за всеми частями ключа следует DESC
, то данный ключ читается в обратном порядке (see section 5.2.7 Как MySQL оптимизирует ORDER BY
).SELECT key_part3 FROM table_name WHERE key_part1=1
Предположим, что вызывается следующий оператор SELECT
:
mysql> SELECT * FROM tbl_name WHERE col1=val1 AND col2=val2;
Если по столбцам col1
и col2
существует многостолбцовый индекс, то соответствующие строки могут выбираться напрямую. В случае, когда по столбцам col1
и col2
существуют раздельные индексы, оптимизатор пытается найти наиболее ограничивающий индекс путем определения, какой индекс найдет меньше строк, и использует данный индекс для выборки этих строк.
Если данная таблица имеет многостолбцовый индекс, то любой крайний слева префикс этого индекса может использоваться оптимизатором для нахождения строк. Например, если имеется индекс по трем столбцам (col1,col2,col3
), то существует потенциальная возможность индексированного поиска по (col1
), (col1,col2
) и (col1,col2,col3
).
В MySQL нельзя использовать частичный индекс, если столбцы не образуют крайний слева префикс этого индекса. Предположим, что имеются команды SELECT
, показанные ниже:
mysql> SELECT * FROM tbl_name WHERE col1=val1; mysql> SELECT * FROM tbl_name WHERE col2=val2; mysql> SELECT * FROM tbl_name WHERE col2=val2 AND col3=val3;
Если индекс существует по (col1,col2,col3
), то только первый показанный выше запрос использует данный индекс. Второй и третий запросы действительно включают индексированные столбцы, но (col2
) и (col2,col3
) не являются крайней слева частью префиксов (col1,col2,col3
).
MySQL применяет индексы также для сравнений LIKE
, если аргумент в выражении LIKE
представляет собой постоянную строку, не начинающуюся с символа-шаблона. Например, следующие команды SELECT
используют индексы:
mysql> SELECT * FROM tbl_name WHERE key_col LIKE "Patrick%"; mysql> SELECT * FROM tbl_name WHERE key_col LIKE "Pat%_ck%";
В первой команде рассматриваются только строки с "Patrick" <= key_col < "Patricl"
, а во второй - только строки с "Pat" <= key_col < "Pau"
.
Следующие команды SELECT
не будут использовать индексы:
mysql> SELECT * FROM tbl_name WHERE key_col LIKE "%Patrick%"; mysql> SELECT * FROM tbl_name WHERE key_col LIKE other_col;
В первой команде величина LIKE
начинается с шаблонного символа. Во второй команде величина LIKE
не является константой.
В версии MySQL 4.0 производится другая оптимизация на выражении LIKE
. Если используется выражение ... LIKE "%string%"
и длина строки (string) больше, чем 3 символа, то MySQL будет применять алгоритм Турбо Бойера-Мура для инициализации шаблона для строки и затем использовать этот шаблон, чтобы выполнить поиск быстрее.
При поиске с использованием column_name IS NULL
будут использоваться индексы, если column_name
является индексом.
MySQL обычно использует тот индекс, который находит наименьшее количество строк. Индекс применяется для столбцов, которые сравниваются с помощью следующих операторов: =, >, >=, <, <=, BETWEEN
и LIKE
с префиксом, не содержащим шаблонного символа, такого как something%
.
Если индекс не охватывает все уровни AND
в выражении WHERE
, то он не применяется для оптимизации данного запроса. Другими словами: чтобы индекс можно было использовать, префикс этого индекса должен входить в каждую группу AND
.
Следующие выражения WHERE
используют индексы:
... WHERE index_part1=1 AND index_part2=2 AND other_column=3 ... WHERE index=1 OR A=10 AND index=2 /* индекс = 1 ИЛИ индекс = 2 */ ... WHERE index_part1='hello' AND index_part_3=5 /* оптимизировано как "index_part1='hello'" */ ... WHERE index1=1 and index2=2 or index1=3 and index3=3; /* Можно использовать индекс по index1, но не по index2 или index 3 */
Следующие выражения WHERE
не используют индексы:
... WHERE index_part2=1 AND index_part3=2 /* index_part_1 не используется */ ... WHERE index=1 OR A=10 /* Индекс не используется в обеих частях AND */ ... WHERE index_part1=1 OR index_part2=10 /* Нет индекса, покрывающего все строки*/
В некоторых случаях MySQL не использует индекс, даже если это возможно. Несколько примеров таких ситуаций приведено ниже:
LIMIT
по отношению только к извлекаемой части строк, то MySQL будет применять индекс в любом случае, так как небольшое количество строк можно найти намного быстрее, чтобы вернуть результат.NULL
при использовании выражений ORDER BY ... DESC
.Posted by on Tuesday July 23 2002, @3:42pm | [Delete] [Edit] |
One case when mySQL 3.23 does not use an index is
if it has to implicitly convert types.
Imagine you have a column of a VARCHAR type but
query this in the form "SELECT * FROM tablename
WHERE columnname = 123"; mySQL implicitly converts
123 to "123" but then does a full table scan.
Posted by on Friday November 1 2002, @8:03am | [Delete] [Edit] |
This section should include information about the cost of indexes. The size of an index and the cost of keeping an index current. An over view of how to determine when to use an index would be good too.
Posted by on Friday February 28 2003, @3:31pm | [Delete] [Edit] |
It appears that queries with OR don't use indices:
describe SELECT person FROM person WHERE email1='foo' OR email2='foo';
+--------+------+---------------+------+---------+------+-------+-------------+
| table | type | possible_keys | key | key_len | ref | rows | Extra |
+--------+------+---------------+------+---------+------+-------+-------------+
| person | ALL | email1,email2 | NULL | NULL | NULL | 57051 | Using where |
+--------+------+---------------+------+---------+------+-------+-------------+
Add your own comment.