Главная » Записи с тегом "парсер"

Рубрики с меткой ‘парсер’

PHP и XML

Итак, поговорим об XML. Что же это такое и почему многие профессиональные программисты предпочитают его всем другим форматам? И почему так много хвалебных отзывов со стороны тех, кто с ним столкнулся? И почему, наконец, так мало негативных отзывов от тех, кто с ним не сталкивался :-) ? XML как язык (а это именно язык, только не программирования, а разметки) сформировался сравнительно недавно — официально первая редакция его спецификации была опубликована в 1998 году. Формат этот оказался настолько удачным, что сразу пришелся ко двору, и его реализации разошлись практически по всем языкам программирования (правда, пока еще в виде внешних модулей или обработчиков) — от Delphi до PHP. Однако русскоязычной документации по нему мало, а сам язык настолько масштабируем и гибок, что описать все области его применения просто невозможно. Поэтому отечественные программисты еще только начинают постигать тайны XML и пока лишь пытаются применять его на практике.

Ловля ошибок в PHP

На серъезных сайтах странно видеть, когда ошибки выводятся пользователю в браузер в самых неожиданных местах. Почему они выводятся? Ведь текст ошибок является информацией для дебага и предназначена для разработчика, а не для клиента. Пишем программу, делающую лог ошибок и прячем их от пользователя.

Кроме того, именно эта служебная информация обычно помогает злым хакерам ломать сайт. В качестве классического примера можно привести вариант с выводом запроса при ошибке: «you have an error in query near WHERE id= «… Большое спасибо. Подставляем после «WHERE id=…» строку «0 OR 1>0″ и запрос выполняется по всей таблице. Если запрос на удаление, то…сами понимаете, весело =). Поэтому я всегда переменные в запросах заключаю в кавычки. На всякий случай…
Читать далее »

Парсер на РНР — это возможно!

В данной коротенькой статье я хочу продемонстрировать, что РНР может очень хорошо справляться с функцией синтаксического разбора выражений. Для тех, кто никогда не касался данной тематики, я думаю, статья будет так же интересна, поскольку в ней мы рассмотрим метод программирования в виде конечных автоматов.

Начну с утверждения, что метод программирования с применением конечных автоматов очень прост, поскольку большая часть программы содержится внутри автомата, который вы готовите заранее в виде матрицы и используете в своей программе.
Читать далее »

Поиск на php

95% бесплатных php-скриптов (и не только php) — полный «отстой». Оно и понятно: хороший программист бесплатно ничего писать не будет, а если и будет, то только в свободное время в качестве развлечения, и уж, конечно не всякие банальности, вроде гостевых книг. Или, как говорил Рома Воронежский: «Вот проблема с этими творческими людьми: они всегда желают быть композиторами, художниками и писателями. В результате производством труб большого диаметра занимаются бездарности».

Именно так это и происходит. Читать далее »

Прощай FeedAPI, здравствуй Feeds!

С запуском Managing News мы выпустили Feeds — следующий шаг в развитии FeedAPI. Feeds это следующее поколение АПИ для сбора содержания, в котором учтён опыт полученный нами за три года работы над сбором содержания в Друпале. Это один из результатов той работы, которую мы ведём над Managing News и это одна из самых интересных частей этой сборки. Мы хотим выразить благодарность Knight Foundation за их работу по улучшению и поддержке инструментов сбора содержания в Друпале, которые помогли создать Feeds. В этой статье я хочу объяснить причины, по которым мы решили сделать новый АПИ, рассказать о наших целях и что эта ситуация означает для FeedAPI.

Прошло более двух лет с момента нашего разговора с Кеном Рикардом на OSCON и публикации предложений по Aggregator API. Результатом этого стала успешная работа на Google Summer of Code и модуль FeedAPI, который был разработан и поддерживался большей частью Ароном Новаком. С тех пор, мы очень активно использовали FeedAPI в большинстве наших проектов, улучшали его, расширяли и накопили большой опыт по работе со сбором содержания. Читать далее »