Главная » Полезные статьи » Язык PHP » Удобный и безопасный поиск на сайте
Распечатать статью

Удобный и безопасный поиск на сайте

Главная проблема с которой сталкивается программист — это нарастание кода при кажущейся простоте скрипта поиска для сайта. Так что сразу настроимся на то, что кодить мы будем много и с умом.

Обработка строки поиска
Первое, что мы делаем с запросом – это обрезаем строку поиска функцией substr:

$search = substr($search, 0, 64);

64 символа вполне хватит пользователю для поиска по сайту.

Теперь наступает очеред вырезать все опасные и не нужные нам символы из строки:

$search = preg_replace("/[^(w)|(x7f-xff)|(s)]/", " ", $search);

По идее, разрешать пользователям искать по сайту небольшими запросами из 1-2 символом нельзя – при большой посещаемости это может стать причиной большой нагрузки на сервер, поэтому ограничим поиск поисковыми фразами только больше 2 символов.

Итак, разрешим искать только по словам, которые длиннее двух букв (если ограничение больше, надо заменить «{1,2}» на «{1, кол-во символов}»):

$good = trim(preg_replace("/s([^s]{1,2})s/", " ", ereg_replace("[ ]+", " "," $search ")));

Затем после замены ненужных символов неплохо было бы убрать двойные пробелы из нашего запроса (они были сделаны специально для корректного поиска коротких слов):

$good = ereg_eplace("[ ]+", " ", $good);

Логика поискового запроса
Допустим, мы хотим предоставить пользователю возможность выбирать логику поиска — искать все слова или только одно из нескольких. Если вы хотите сделать как в Яндексе [2] [1] — два амперсанта означают «И» (слово1&&слово2&&слово3) или как-то еще, то я не советчик. Шаманство со строками на небольшом сайте imho не оправдывает затраченного
времени. Поэтому форму для поиска рисуем так:

искать любое из слов или искать все слова

А в поисковом скрипте лишний раз проверяем, что пользователь ввел:

if ($logic!="and" && $logic!="or") $logic = "or"; Как будет использоваться логика — ниже.

Релевантность поиска
Наверное, в том же Яндексе [2] [1] все видели ссылочку «сортировать по релевантности». Это оно и есть. Сортировка результатов по количеству совпадений слов.

Отчасти, кстати, такая сортировка снимает проблему обработки логики поиска. Но с БД
mysql делать такую сортировку очень сложно. Надо сперва выбрать, где есть все слова,
потом записи, где разные слова (исключив предыдущие). Если у вас постраничный вывод —
то вообще дело труба!

Статистика поиска
Неплохо будет сразу информировать пользователя, сколько он нашел строк таблицы. Для
этого делается дополнительный запрос в базу:

$query = "select id from table where field like '%". str_replace(" ", "%' or field like '%", $good). "%'";

Для статистики по отдельным словам можно сделать следующее:

$word = explode(" ", $search); while (list($k, $v) = each($word)) { if (strlen($v)>2) $stat[]="$v:". mysql_num_rows(mysql_query("select id from table where field like '%$v%'")); else $stat[]="$v: <font color=#cc0000>короткое</font>"; }; $word_stats = "Статистика слов: ". implode("", $stat). "<br />"; unset($stat);

Постраничный вывод результатов
Ну, когда у нас есть макет для поиска и количество строк результата поиска, сделать
постраничный поиск — пара пустяков. Проверяем переменную $page (не меньше 0, не больше

$results_amount/$rows_in_page).

В запрос, который подсчитывает количество строк (смотри выше), пишем нужные нам поля и поля для сортировки. А потом дописываем

if ($page==0) $request .= "limit $rows_in_page"; else $request .= "limit ". $page*$rows_in_page. ",". $rows_in_page; (синтаксис: limit <кол-во строк> либо limit <кол-во строк отступа>, <кол-во строк>)

В результате выполнения подобного запроса мы получим именно те самые строки, которые надо выводить на странице.

Для навигации можно либо рисовать ссылки на следующую и предыдущую страницы, либо, что сложнее, делать панель навигации на несколько страниц.

if ($page>0) print ("<a href=search.php?search=". rawurlencode($good). "&page=". ($page-1). ">предыдущая страница</a>");

 

if ($page<$results_amount/$rows_in_page) print ("<a href=search.php?search=". rawurlencode($good). "&page=". ($page+1). ">следующая страница</a>");

Подсветка поисковых фраз
Для того, что бы подсветить поисковые запросы жирным шрифтом (а может быть определённым цветом, кому как больше нравиться), необходимо сделать всего лишь следующее:

$highlight = "(". str_replace(" ", "|", $good). ")";

Пробелы (а они у нас между словами стоят поодиночке, и нигде двойной пробел не встречается, к тому же с концов строки мы их тоже вырезали) достаточно заменить на вертикальную черту – разделитель вариантов в регулярных выражениях. «Плохие» слова мы не подсвечиваем, потому что в базе их не ищем :).

В коде, который выводит текст пишем:

$row["text"] = ereg_replace($highlight, "<font color=#cc0000>1</font>", $row["text"]);

Если же у вас в тексте встречаются html теги, то следует поступить вот так:

$text = eregi_replace(">([^<]*)$words", ">1<font color=#cc0000>2</font>3<", $text);

И в завершении я бы посоветовал сделать отдельную функцию, которая бы вырезала не только из поиска, но и вообще из всех полей ввода слова: INSERT, SELECT, DELETE и другие SQL команды, которые могут вызвать неприятности.

Подводим итог
Применяя все эти приёмы в совокупности (а именно так я и советую), можно добиться вполне неплохого поиска на собственном сайте, а вместе с этим сделать его безопасным для сайта и не дать пользователю, который хотел бы навредить сайту:

а) узнать программную структуру сайта;
б) вызвать перегрузку сервера бессмысленными запросами к базе данным;
в) пользовать не увидит ошибки, если в запрос попал запрещённый символ…

А ещё мы помогли пользователю скорее сориентироваться, сделав подсветку поисковых фраз и разделив найденный текст по страницам.

Источник: internet-technologies.ru

Вы можете оставить комментарий, или обратную ссылку на Ваш сайт.

Оставить комментарий

Похожие статьи