Парсер контента: Глобальное обновление до версии 5.0.0
7 марта 2015
Автор: Шашалевич Станислав
Компания Сотбит ответственно и с любовь относится к каждому своему творению в Маркетплейс. Особенно это касается топ-решений, которые воодушевляют нас и помогают клиентам решать свои насущные задачи. Еженедельно и ежемесячно мы производим незначительные доработки по просьбам наших клиентов. Глобальные же обновления мы, как правило, выпускаем два раза в год, тем самым выполняя все пожелания клиентов по улучшению наших модулей.
Топ-модуль «Парсер контента» один из наших самых любимых. И вот, как раз, настало и его время для глобального и необходимого обновления. Версия модуля повысилась до 5.0.0
Для начала перечислим наиболее интересные и важные обновления вкратце, а уже потом рассмотри каждый пункт по отдельности.
1. Возможность загрузки офферов табличного вида
2. Возможность деактивации, удаления товаров, которые отсутствуют в текущей выгрузке
3. Полная переработки визуального представления свойств
4. Возможность добавления новых свойств прямо из формы редактирования парсера
5. Появилась возможность выгрузки свойств из превью карточки товара
6. Работа со свойствами типа Справочник
7. Возможность загружать доп файлы(инструкции, каталоги)
8. Возможность выгрузки в свойство типа HTML
9. Картинки в описаниях загружаются в медиабиблиотеку
10. Событийная модель
11. Округление цен
12. И другие незначительные доработки
А теперь рассмотрим подробнее каждый момент.
1. Возможность загрузки офферов табличного вида
Теперь парсер научился парсить торговые предложения табличного вида. То есть офферы должны располагаться в карточке товара в таблице,
приблизительно так:
Чтобы решить данную задачу мы в интерфейс парсера добавили еще одну вкладку «Торговые предложения»
Выгружать офферы – выбор типа выгрузки офферов. На данный момент только один тип: табличный. По умолчанию выгрузка офферов не предусмотрена.
Параметр уникализации – важный параметр, определяющий по каким параметрам будет происходить уникализация офферов.
Особенности:
1. Указанные свойства добавляются в название оффера.
2. Если название оффера отсутствует, то название полностью будет состоять из значений указанных свойств.
3. По данному параметру происходит уникализации офферов.
4. Если ничего не указано, то уникальность будет определяться по названию оффера.
Главный селектор контейнера торговых предложений – селектор контейнера офферов относительно селектора детальной страниы. Например: table.
Селектор блока шапки таблицы – селектор шапки таблицы относительно предыдущего параметра. Это поле требуется, если поиск параметров идет по названию. Например: thead tr
Селектор наименования параметра в шапке таблицы – селектор конкретного наименования параметра относительно предыдущего параметра. Это поле требуется, если поиск параметров идет по названию. Например: th
Селектор отдельного оффера – селектор блок торгового предложения относительно главного селектора офферов. Например: tbody tr
Селектор значения параметра в теле таблицы – селектор конкретного значения параметра относительно предыдущего параметра. Например: td
Далее следует блок полей, связанных непосредственно с парсингом значений а таблице
Парсинг полей по селектору -
Удалять символы – какие символы необходимо удалять из значений параметров. Перечисление идет через ||
Наименование – селектор названия оффера
Цена – селектор цены оффера
Парсинг полей и свойств по названию – происходит поиск значений параметров по наименованию в шапке таблицы.
Удалять символы – удалять лишние символы. Перечисление через ||
Далее идут параметры, которые необходимо найти. Для этого нужно указать название параметра в шапке таблицы
2. Возможность деактивации, удаления товаров, которые отсутствуют в текущей выгрузке
Теперь появилась возможность отслеживания товаров выгруженных в текущей и прошлой выгрузке. Для этого во вкладку «Обновление / Уникальность» добавились доп. поля.
Существует три значения данного режима:
- ничего не делать – если товар отсутствует в текущей выгрузке, то с ним ничего происходить не будет
- деактивировать – если товар отсутствует в текущей выгрузке и присутствовал в предыдущей, то он будет деактивирован
- удалить – товар будет удален, если он отсутствует в текущей выгрузке
3. Полная переработки визуального представления свойств
Мы тщательно поработали над визуализацией формы парсинга свойств. И мы сделали так, что теперь настройка данного функционала стала простой и удобной.
Вместо длинного полотна из свойств теперь все свойства располагаются в селекте. Необходимо выбрать нужное свойство и кликнуть Добавить. Свойства автоматически добавится.
4. Возможность добавления новых свойств прямо из формы редактирования парсера
Связано с предыдущим пунктом. Необходимо в селекте свойств выбрать Создать и кликнуть Добавить. Сразу появится подобное всплывающее окно
5. Появилась возможность выгрузки свойств из превью карточки товара
Очень необходимый функционал загрузки свойств прямо из списка товаров. Для этого мы во вкладку «Свойства» добавили отдельные поля для парсинга свойств из превью.
Если свойства заданы и в деталке и в превью, то детальные свойства находятся в приоритете.
6. Работа со свойствами типа Справочник
Появилась возможность работы со свойствами типа Справочник. Работает по аналогичному принципу, как при выгрузке 1с.
7. Возможность загружать доп файлы(инструкции, каталоги)
Еще одно интересное обновление, позволяющее загружать файлы различного типа с удаленного ресурса. Как правило, это документы, инструкции и прочее.
Но, чтобы загрузить свойство типа Файл необходимо не только указать селектор свойства, но и атрибут, в котором содержится ссылка на указанный файл. Например: a[href]
8. Возможность выгрузки в свойство типа HTML
Появилась возможность выгружать html текст не только в описания, но и любое свойство HTML вида.
9. Картинки в описаниях загружаются в медиабиблиотеку
Ранее была проблема, что все файлы из описаний загружались в определенную папку на сервере и почистить эту папку было проблематично. Теперь же все картинки из превью и детальных описаний выгружаются в медиабиблиотеку и вы легко можете откорректировать или удалить любую картинку.
10. Событийная модель
Парсер открыл эру событийной модели. На данный момент внедрено два типа событий:
parserCatalogPreview – событие, вызываемое сразу после парсинга превью товара
parserCatalogDetail – событие, вызываемое сразу после парсинга деталки товара
В обработчик данных событий входят следующие параметры:
parserCatalogPreview($id, &$el, &$arFields)
$id – айди парсера
$el – ссылка на объект, который был получен в результате парсинга
$arFields – ссылка на массив, который будет передан в функцию создания или обновления элемента.
11. Округление цен
Теперь цены можно округлять до нужного значения. Для этого во вкладку «Торговый каталог» мы добавили необходимые поля.
Округление цены возможно:
- Округлять с указанной точностью. В данном случае необходимо указать – сколько знаков после запятой будет округляться
- Округлять в большую сторону до целого числа
- Округлять в меньшую сторону до целого числа
Также были и другие мелкие и незанчительные доработки и исправления, о которых в данной статье упоминать не будем.
Данное глобальное обновление значительно увеличило функциональные возможности модула, а также упростило работу с ним. но это лишь малая часть того, что будет реализовано в будущем. Парсер контента и дальше будет радовать своих клиентов приятными и полезными новинками и улучшениями! Ждите обновлений!
Топ-модуль «Парсер контента» один из наших самых любимых. И вот, как раз, настало и его время для глобального и необходимого обновления. Версия модуля повысилась до 5.0.0
Для начала перечислим наиболее интересные и важные обновления вкратце, а уже потом рассмотри каждый пункт по отдельности.
1. Возможность загрузки офферов табличного вида
2. Возможность деактивации, удаления товаров, которые отсутствуют в текущей выгрузке
3. Полная переработки визуального представления свойств
4. Возможность добавления новых свойств прямо из формы редактирования парсера
5. Появилась возможность выгрузки свойств из превью карточки товара
6. Работа со свойствами типа Справочник
7. Возможность загружать доп файлы(инструкции, каталоги)
8. Возможность выгрузки в свойство типа HTML
9. Картинки в описаниях загружаются в медиабиблиотеку
10. Событийная модель
11. Округление цен
12. И другие незначительные доработки
А теперь рассмотрим подробнее каждый момент.
1. Возможность загрузки офферов табличного вида
Теперь парсер научился парсить торговые предложения табличного вида. То есть офферы должны располагаться в карточке товара в таблице,
приблизительно так:
Чтобы решить данную задачу мы в интерфейс парсера добавили еще одну вкладку «Торговые предложения»
Выгружать офферы – выбор типа выгрузки офферов. На данный момент только один тип: табличный. По умолчанию выгрузка офферов не предусмотрена.
Параметр уникализации – важный параметр, определяющий по каким параметрам будет происходить уникализация офферов.
Особенности:
1. Указанные свойства добавляются в название оффера.
2. Если название оффера отсутствует, то название полностью будет состоять из значений указанных свойств.
3. По данному параметру происходит уникализации офферов.
4. Если ничего не указано, то уникальность будет определяться по названию оффера.
Главный селектор контейнера торговых предложений – селектор контейнера офферов относительно селектора детальной страниы. Например: table.
Селектор блока шапки таблицы – селектор шапки таблицы относительно предыдущего параметра. Это поле требуется, если поиск параметров идет по названию. Например: thead tr
Селектор наименования параметра в шапке таблицы – селектор конкретного наименования параметра относительно предыдущего параметра. Это поле требуется, если поиск параметров идет по названию. Например: th
Селектор отдельного оффера – селектор блок торгового предложения относительно главного селектора офферов. Например: tbody tr
Селектор значения параметра в теле таблицы – селектор конкретного значения параметра относительно предыдущего параметра. Например: td
Далее следует блок полей, связанных непосредственно с парсингом значений а таблице
Парсинг полей по селектору -
Удалять символы – какие символы необходимо удалять из значений параметров. Перечисление идет через ||
Наименование – селектор названия оффера
Цена – селектор цены оффера
Парсинг полей и свойств по названию – происходит поиск значений параметров по наименованию в шапке таблицы.
Удалять символы – удалять лишние символы. Перечисление через ||
Далее идут параметры, которые необходимо найти. Для этого нужно указать название параметра в шапке таблицы
2. Возможность деактивации, удаления товаров, которые отсутствуют в текущей выгрузке
Теперь появилась возможность отслеживания товаров выгруженных в текущей и прошлой выгрузке. Для этого во вкладку «Обновление / Уникальность» добавились доп. поля.
Существует три значения данного режима:
- ничего не делать – если товар отсутствует в текущей выгрузке, то с ним ничего происходить не будет
- деактивировать – если товар отсутствует в текущей выгрузке и присутствовал в предыдущей, то он будет деактивирован
- удалить – товар будет удален, если он отсутствует в текущей выгрузке
3. Полная переработки визуального представления свойств
Мы тщательно поработали над визуализацией формы парсинга свойств. И мы сделали так, что теперь настройка данного функционала стала простой и удобной.
Вместо длинного полотна из свойств теперь все свойства располагаются в селекте. Необходимо выбрать нужное свойство и кликнуть Добавить. Свойства автоматически добавится.
4. Возможность добавления новых свойств прямо из формы редактирования парсера
Связано с предыдущим пунктом. Необходимо в селекте свойств выбрать Создать и кликнуть Добавить. Сразу появится подобное всплывающее окно
5. Появилась возможность выгрузки свойств из превью карточки товара
Очень необходимый функционал загрузки свойств прямо из списка товаров. Для этого мы во вкладку «Свойства» добавили отдельные поля для парсинга свойств из превью.
Если свойства заданы и в деталке и в превью, то детальные свойства находятся в приоритете.
6. Работа со свойствами типа Справочник
Появилась возможность работы со свойствами типа Справочник. Работает по аналогичному принципу, как при выгрузке 1с.
7. Возможность загружать доп файлы(инструкции, каталоги)
Еще одно интересное обновление, позволяющее загружать файлы различного типа с удаленного ресурса. Как правило, это документы, инструкции и прочее.
Но, чтобы загрузить свойство типа Файл необходимо не только указать селектор свойства, но и атрибут, в котором содержится ссылка на указанный файл. Например: a[href]
8. Возможность выгрузки в свойство типа HTML
Появилась возможность выгружать html текст не только в описания, но и любое свойство HTML вида.
9. Картинки в описаниях загружаются в медиабиблиотеку
Ранее была проблема, что все файлы из описаний загружались в определенную папку на сервере и почистить эту папку было проблематично. Теперь же все картинки из превью и детальных описаний выгружаются в медиабиблиотеку и вы легко можете откорректировать или удалить любую картинку.
10. Событийная модель
Парсер открыл эру событийной модели. На данный момент внедрено два типа событий:
parserCatalogPreview – событие, вызываемое сразу после парсинга превью товара
parserCatalogDetail – событие, вызываемое сразу после парсинга деталки товара
В обработчик данных событий входят следующие параметры:
parserCatalogPreview($id, &$el, &$arFields)
$id – айди парсера
$el – ссылка на объект, который был получен в результате парсинга
$arFields – ссылка на массив, который будет передан в функцию создания или обновления элемента.
11. Округление цен
Теперь цены можно округлять до нужного значения. Для этого во вкладку «Торговый каталог» мы добавили необходимые поля.
Округление цены возможно:
- Округлять с указанной точностью. В данном случае необходимо указать – сколько знаков после запятой будет округляться
- Округлять в большую сторону до целого числа
- Округлять в меньшую сторону до целого числа
Также были и другие мелкие и незанчительные доработки и исправления, о которых в данной статье упоминать не будем.
Данное глобальное обновление значительно увеличило функциональные возможности модула, а также упростило работу с ним. но это лишь малая часть того, что будет реализовано в будущем. Парсер контента и дальше будет радовать своих клиентов приятными и полезными новинками и улучшениями! Ждите обновлений!
Статья полезна для
Предлагаем еще прочесть