|
...применения "контент-инжиниринга"Понятие «контент-инжиниринг» появилось совсем недавно и как почти всегда бывает в случае появления нового термина, сегодня, пожалуй, нет точного определения – что же такое «контент-инжиниринг».
«Хотя контент активно используется и существует в разных информационных системах, его производство все еще остается на примитивном уровне. Контент в значительной степени производится на «ремесленном» уровне. Интернет-технологии положили начало новому понятию «контент-инжиниринг». Контент-инжиниринг означает индустриализацию в обработке контента. Подходы контент-инжиниринга направлены на то, чтобы освободить авторов от работы по отбору и подготовке материалов для специфической аудитории и форматированию информации для специфического устройства отображения. Контент-инжиниринг должен дать возможность автоматически производить широкий диапазон персонифицированных контент-продуктов за счет возможности установления и использования отношений и связей между понятиями и элементами контент-источников. Таким образом, уменьшается время выхода контента на рынок, уменьшаются затраты на создание контента и обеспечивается большая точность и последовательность контент-продуктов. На первый взгляд, контент-инжиниринг - это другое название «управления контентом» (content-management). Но на самом деле, управление контентом и контент-инжиниринг – это различные понятия. Технологии управления контентом обеспечивают хранение и извлечение контента, в то время как предмет контент-инжиниринга – это создание процессов преобразования «сырого» контента в информационный продукт, необходимый посетителю Web-ресурса. Например, когда говорят о помощи, оказываемой системой управление контентом в использовании контента «в других целях», это означает, что она помогает найти части контента, чтобы автор мог использовать их вручную. Когда контент-инжиниринг говорит об использовании контента «в других целях», это означает применение сложной автоматической обработки по сбору контента из разных источников для использования его при создании нового фрагмента контента. Если идет речь об осуществлении персонализации на основе правил, «доставить правильную информацию правильному человеку», то это означает, что система управления контентом применит ряд правил выбора информации, сформулированных пользователями по принципу «выберите соответствующую часть статического содержания». Когда говорится об осуществлении персонализации на основе правил в рамках разговора о контент-инжиниринге то, это означает, что будут применяться ряд правил к отдельным элементам информации для создания нового фрагмента контента, «настроенного» на клиента. Рассмотрим проект создания собрания обзоров кинофильмов и ассоциированной с ними информации и производства контент-продукции на базе этой информации для различных СМИ. Обзоры кинофильмов полны ссылками на другие фильмы, актеров, фамилии директоров, места, времена и темы. Эти ссылки - хороший способ создания связей с другими ресурсами, например биографическими, картографическими или историческими. При таком большом количестве потенциальных связей явно желательна некоторая поддержка управления этими связями. Системы управления контентом предлагают возможности управления связями. Используя такую систему, авторы обзора установили бы связи с текстами специализированных ресурсов, а система обеспечит проверку того, что связи работают, и поможет поддерживать связи, если страницы с контентом будут перемещены или переименованы.» Читайте также What is Content Engineering? Однако можно и построить более сложную систему – не просто установка гиперссылок на нужные страницы в Интернет, а извлечение с этих Web-ресурсов необходимых блоков информации – например, для упомянутого выше собрания обзоров кинофильмов – года рождения режиссера, продюссера, исполнителя главной роли и сведение их в единую таблицу. Или выбор и анализ информации – в каких кинофильмах режиссер и исполнитель главной роли работали вместе ранее и создание отдельной рубрики в создаваемом ресурсе – предыдущие совместные работы. Надо отметить, что произвести с помощью технологий автоматизированной обработки контента законченный информационный продукт (статью, обзор, …) - текст, имеющий легко читаемую структуру (заголовок, вступление, основной текст, окончание), и приемлемый для чтения литературный язык, представляется возможным лишь в ограниченном числе случаев, когда требования к «литературной составляющей» текста невысоки. В остальных же случаях технологии автоматизированной обработки контента помогают редактору в формировании информационного продукта, который может быть представлен аудитории. Отдельный случай – бизнес-контент (т.е. контент, который используется в информационных системах поддержки бизнес-процессов), который может состоять из набора строго определенных и формализованных текстовых блоков, цифровой информации, таблиц и т.д. В этих случае, поскольку речь идет о строго описанных и алгоритмизированных процессах, технологии позволяют производить новые контент-продукты в автоматическом режиме. Например, по чертежам подготовить технологические карты обработки детали, или по данным о пришедших на расчетный счет платежах построить Web-таблицу/отчет в удобной для руководителя форме. Контент-модельВ рассматриваемом контексте "контент-модель" можно рассматривать как описание Web-ресурса, в том числе:
Эти элементы определяют, насколько легко пользователи смогут ориентироваться в предложенном содержании и интерактивных функциях мобильного портала. Структурирование контентаДля эффективного использования элементов контента, на одном из первых этапов работы по созданию сайта необходимо структурировать и разбить контент на блоки, которые затем будут использоваться для группировки и отображения в окне Web-браузера пользователя. Структуризация предполагает как тематическую рубрикацию контента, так и разбиение его на информационные элементы, которые могут использоваться по отдельности. Рубрицирование контента – это привязка информационных материалов к темам. Разработка рубрикатора достаточно сложная задача, которая решается с участием экспертов в предметной области. Рубрикатор, как правило, не должен совпадать с информационной структурой сайта, позволяющей осуществлять навигацию по сайту. Задача рубрикатора – дать дополнительную возможность поиска информации на сайте и обеспечить работу системы управления контентом. Рубрикаторов может быть несколько. Например, для корпоративного сайта компании, предоставляющей услуги по внедрению информационных систем на предприятии рубрикаторы могут быть сформированы по классу решений (ERP-системы, системы хранения данных, системы автоматизированного проектирования, …), по отраслевому признаку - решения для различных отраслей, предлагаемые компанией. А система навигации по сайту может отталкиваться от услуг компании (консалтинговые услуги, услуги по разработке и внедрению бизнес-приложений …) или направлений деятельности (электронный бизнес, корпоративные информационные системы …). В качестве примера – www.topsbi.ru. Для текстовых материалов отдельными информационными элементами будут чаще всего: заголовок, аннотация, основной текст, графические иллюстрации. При раздельном хранении эти элементы могут использоваться для формирования различных типов страниц Web-ресурса: например, список заголовков новостей (с аннотациями и без), страницы с текстом новостей. При этом появляется возможность каждому информационному элементу задать свой стиль оформления: заголовок жирным шрифтом (bold) большего размера, аннотация – курсивом (italic), основной текст – шрифтом, который используется на сайте для всех текстов. Многократное использование контентаОдна из серьезных проблем, существующих в информационном мире – дублирование контента. Разные производители контента могут повторять работу, делая, например, описание одного и того же технического изделия. Гипертекстовый механизм предоставляет широкие возможности для многократного использования контента. Если по какой-то тематике существует квалифицированно подготовленная информация, то при разработке Web-ресурсов смежной тематики нет необходимости делать эту работу еще раз – достаточно сделать гиперссылку на уже созданный документ. Но установка гиперссылки - это один из самых простых случаев повторного использования контента. Возможны и более сложные способы, когда используется не все содержимое Web-страницы, а ее фрагменты. Чтобы автоматизировать такой процесс, эти фрагменты должны быть представлены в виде «распознаваемом» автоматизированной системой подготовки контента как отдельные элементы. В ограниченном виде эти возможности заложены в язык гипертекстовой разметки HTML. Например, мета-тэги, используемые поисковыми системами. Пример применения мета-тегов (ресурс www.e-commerce.ru) <meta name="keywords" content="e-commerce, business, e-business, b2b, b2c, CRM, EAI, ERP, SCM, e-procurement, supply chain, электронная коммерция, коммерция, бизнес, электронный бизнес, on-line, платежи, магазин, кредитные карты"> <meta name="description" content="e-Commerce.ru концентрирует информацию об электронном бизнесе и электронной коммерции, в том числе: бизнес, стратегии, технологии, новости, события, тенденции развития в мире и России. "> Более широкие возможности дает применение языка XML. «XML (Extensible Markup Language) - это язык разметки, описывающий класс объектов данных, называемых XML- документами. … одним из очевидных достоинств XML является возможность использования его в качестве универсального языка запросов к хранилищам информации. XML позволяет также осуществлять контроль за корректностью данных, хранящихся в документах, производить проверки иерархических соотношений внутри документа и устанавливать единый стандарт на структуру документов, содержимым которых могут быть самые различные данные. Это означает, что его можно использовать при построении сложных информационных систем, в которых очень важным является вопрос обмена информацией между различными приложениями, работающими в одной системе. Создавая структуру механизма обмена информации в самом начале работы над проектом, менеджер может избавить себя в будущем от многих проблем, связанных с несовместимостью используемых различными компонентами системы форматов данных.» http://cetis.ru/library/xml/part1.html#p3 Пример XML-кода для публикации новостной ленты www.e-commerce.ru: <?xml version="1.0" encoding="windows-1251" ?> - <news> - <item id="12153"> <title>США борется с онлайновым мошенничеством</title> <annotation>Федеральная Торговая Комиссия США подала в суд на одиннадцать компаний, которые предлагали свои услуги через Интернет и были уличены в обмане потребителей.</annotation> <url>http://www.e-commerce.ru/News/2002/04/18/news12153.html</url> </item> - <item id="12152"> <title>GUS бьет рекорды электронной коммерции</title> <annotation>Английская торговая группа, которая владеет множеством оффлайновых и онлайновых магазинов, объявила о том, что за последние полгода ее продажи на электронном рынке выросли на 70% и достигли 98 млн. фунтов стерлингов.</annotation> <url>http://www.e-commerce.ru/News/2002/04/18/news12152.html</url> </item> - <item id="12151"> <title>Visa и MasterCard развивают Р2Р-платежи в Европе</title> <annotation>Международные кредитные компании Visa и MasterCard намерены укрепить свое положение в финансовом секторе за счет предоставления возможности проведения Р2Р-платежей между кредитными и дебетовыми счетами.</annotation> <url>http://www.e-commerce.ru/News/2002/04/18/news12151.html</url> </item> - <item id="12150"> <title>В Японии официально открывается сервис C-Mode</title> <annotation>После нескольких месяцев пилотирования, в Японии открывается сервис мобильной торговли через торговые автоматы C-Mode, который был разработан и воплощен в жизнь компаниями NTT DoMoCo, CocaCola Japan и Itochu.</annotation> <url>http://www.e-commerce.ru/News/2002/04/17/news12150.html</url> </item> - <item id="12149"> <title>WS-Security повысит безопасность Web-сервисов</title> <annotation>Корпорация Microsoft совместно с крупнейшими представителями IT-сектора занялась работой по обеспечению безопасности Web-сервисов, которые лежат в основе стратегии ".Net".</annotation> <url>http://www.e-commerce.ru/News/2002/04/17/news12149.html</url> </item> </news> В приведенном примере видно, что отдельные элементы новостей – заголовок (Title), аннотация (Annotation) и адрес размещения новости в Сети могут быть использованы программой-обработчиком и на их базе созданы различные представления новостной ленты на Web-странице – можно использовать только заголовки новостей и делать гиперссылки на первоисточник новости, а можно к заголовкам добавлять аннотации. С появлением различных устройств доступа в Интернет (настольный компьютер, PDA, мобильный телефон…) задача многократного использования информации заключается также в том, что информация, хранящаяся в одном месте, например, в базе данных информационного портала, может доставляться пользователю уже с учетом того, каким устройством он пользуется. При этом структура контента и его характеристики должны позволять формировать на экране конкретного устройства «читаемую» страницу. Отдельная задача – подготовка контента для передачи другими медиа-средствами. Например, «центральное» новостное агентство может готовить новостные ролики в виде звуковых файлов в аудиоформате MP3 с блоками новостей по определенной теме для передачи их по Интернет региональным радиостанциям. А радиостанции – запускают в эфир эти новостные ролики. Персонализация и кастомизация контентаПри планировании контента Web-ресурса необходимо точно позиционировать – для какой аудитории мы готовим контент. От этого зависит и терминология, которая будет использоваться при подготовке текстов; и степень подробности материала; и способы навигации. Если аудитория Web-ресурса достаточно разнородна, то имеет смысл дать возможность выбора той информации, которую желает просматривать пользователь и настройки пользователем формы отображения информации на экране браузера. При этом под кастомизацией обычно понимают возможности ручной настройки пользователем того, что он желает смотреть. Технологически кастомизация может выполняться различными способами. Один из способов – с применением авторизации пользователя на Web-ресурсе с помощью логина и пароля и хранение персональной информации пользователя в базе данных Web-ресурса. Другой способ - с помощью «cookies». Cookie – это сообщение, передаваемое Web-браузеру от Web-сервера. Браузер хранит сообщение в текстовом файле cookie.txt. Сообщение посылается назад серверу, каждый раз, когда браузер запрашивает страницу с сервера. Главная цель cookie состоит в том, чтобы идентифицировать пользователей и готовить для него кастомизированные страницы. «Cookie - это небольшая порция текстовой информации, которую сервер передает браузеру. Браузер будет хранить эту информацию и передавать ее серверу с каждым запросом как часть HTTP заголовка. Одни значения cookie могут храниться только в течение одной сессии, они удаляются после закрытия браузера. Другие, установленные на некоторый период времени, записываются в файл. Обычно этот файл называется 'cookies.txt' и лежит в рабочей директории установленного на компьютер браузера. Сами по себе cookies не могут делать ничего, это только лишь некоторая текстовая информация. Однако сервер может считывать содержащуюся в cookies информацию и на основании ее анализа совершать те или иные действия. Например, в случае авторизованного доступа к чему либо через WWW в cookies сохраняется login и password в течение сессии, что позволяет пользователю не вводить их снова при запросах каждого документа, защищенного паролем. Простой пример: есть форма, где пользователю предлагается указать свое имя, из нее вызывается скрипт, прописывающий значение cookie в браузер пользователя. При каждом последующем заходе на основе анализа значения cookie из браузера пользователя на странице появляется либо именное приветствие (если есть установленное значение cookie), либо первоначальная форма с запросом имени пользователя (если значение cookie не установлено).»
(Что такое cookies и как с ними работать, Cookies позволяют незаметно для пользователя формировать его «профиль». О правомерности использования cookie идут достаточно длительные дискуссии, но другие способ реализации функций персонализации и кастомизации часто менее удобны для самого пользователя. Читайте: AOL решает использовать cookies (http://www.e-commerce.ru/news/2001/10/09/news10263.html) Европейский Союз поднимает вопрос о введении четких законов в Интернете (http://www.e-commerce.ru/news/2001/12/05/news10819.html) Запрет "сookie"-файлов в Европе может повредить электронной коммерции (http://www.e-commerce.ru/news/2001/11/08/news10561.html) и другие материалы на www.e-commerce.ru Возможно сочетание авторизации с помощью логина и пароля и технологий с использованием cookies. Под персонализацией обычно понимается программная настройка контента для конкретного пользователя на основе той информации о себе, которую он предоставил при регистрации на Web-ресурсе, а также на основе анализа поведения пользователя при посещении Web-ресурса: отслеживание перемещений по ресурсу, анализ информации, которую «потребляет» пользователь, накапливание информации о сделанных покупках в Интернет-магазине и т.д. На основе такой информации создается «профиль» пользователя и в дальнейшем эти данные могут использоваться Web-ресурсами электронной коммерции (Интернет-магазинами, например) для того, чтобы предлагать именно те товары, который находятся в «зоне интересов» данного пользователя. Эта же информация может использоваться для реализации специальных рекламно-маркетинговых приемов – индивидуально настроенная на пользователя реклама. Для реализации функций персонализации, как правило, также используются либо авторизация с помощью логина и пароля, либо cookies. Отслеживание поведения и предпочтений потребителей, а также взаимодействие с ними в реальном времени с помощью технологий персонализации, становится одним из ключевым элементов работы с пользователями не только через Интернет, но также через беспроводные устройства и интерактивное телевидение. По данным компании Datamonitor, инвестиции в технологии персонализации вырастут с 500 млн. долл. в 2001 году до 2.1 млрд. долл. в 2006. Великобритания является крупнейшим европейским инвестором в этом секторе рынка, за ней следуют Германия и Франция. По данным Datamonitor, Северная Америка может рассчитывать на львиную долю этих инвестиций (67%) за счет продаж компаниям, занимающихся электронной коммерцией и эксплуатирующим приложения по обслуживанию потребителей. Европа получит 25% инвестиций (131 млн.), при этом на долю Великобритании придется 28%, на долю Германии - 24%, а Франции достанется 20%. Несмотря на относительно малые экономики, скандинавские страны смогут заработать на персонализации 13% всех европейских инвестиций. Это станет возможно в силу высокого уровня использования технологий связи и Интернета в этом регионе. Технологии персонализации являются наиболее востребованными среди финансовых и розничных компаний, в 2001 году на них приходится 50% инвестиций, как в Северной Америке, так и в Европе. Главную роль в этом играют интернет-банкинг и заказная онлайновая торговля, за ними следуют телекоммуникации и индустрия развлечений.» (http://www.i-b.ru/newsarc.phtml?date=010913&no=5)
Технологии персонализации и кастомизации связаны с использованием приватной информации о пользователе. И это является одной из серьезнейших проблем Интернета. Есть определенная опасность использования приватной информации недобросовестными Web-ресурсами в целях, неоговоренных «политикой приватности» ресурса. Количество публикаций на темы, связанные с использованием приватной информации в Интернет является подтверждением этого. Читайте: Покупателю хорошо - продавцу хорошо (E-tailers Benefit When Customers Run the Show) (http://www.e-commerce.ru/digests/foreign/issue39/press1611.html) Доверие - основа электронной коммерции (Study: Trust Central to E-Commerce, Online Marketing) (http://www.e-commerce.ru/digests/foreign/issue71/press1919.html) Amazon возрождает онлайновый магазин бытовой электроники (http://www.e-commerce.ru/news/2001/12/21/news10989.html) Онлайновая политика приватности должна применяться оффлайновыми организациями (http://www.e-commerce.ru/news/2001/12/17/news10905.html) и другие материалы на www.e-commerce.ru Редакционные способы персонализации и кастомизацииСуществуют и редакционные способы кастомизации и персонализации контента для конкретных групп посетителей сайта. Например, когда в навигации корпоративного Web-сайта предусмотрена «разводка» групп пользователей: профессионалов в данной области, новичков, руководителей, технических специалистов и т.д. Один из примеров такой «редакционной» персонализации – web-сайт компании «Ростокино-Лада» (http://www.rostokino-lada.ru/index.htm), торгующей автомобилями производства Волжского автозавода. Главное меню сайта представлено в виде четырех пунктов:
Надо отметить, что приведенный пример имеет существенный недостаток – первая страница практически не содержит никакой информации и, чтобы перейти к содержательной части сайта, надо совершить еще один переход на следующую страницу. Для того, чтобы сохранить преимущества, указанного выше подхода персонализации и не «отпустить» посетителя, который может не отреагировать на такую, на его взгляд, пустую страницу и уйти с сайта, на главной странице необходимо вводить дополнительные содержательные информационные блоки, которые динамически формируются по определенному алгоритму из контента, содержащегося на сайта – анонсы новостей, событий, информационных материалов, новые поступления в магазин и т.д. (см. раздел «Подходы к формированию Главной страницы корпоративного Web-сайта»).
Таким образом, посетитель, попадая на сайт, может выбрать нужную ему информацию, отнеся себя к той или иной группе. Еще пример: Web-сайт компании - разработчика программных приложений для электронного бизнеса. Среди прочих элементов навигации на сайте имеется навигационный блок, позволяющий посетителю сайта «позиционировать» себя и идти в тот раздел, информация в котором сформирована исходя из потребностей данной группы пользователей: Select a custom view: · Executive · Business Manager · Sales Professional · Service Professional · IT Manager · Small- & Medium-size Business · Partner · Customer · Investor
Контент и дизайнОдной из важных технологических возможностей при создании сайтов стала возможность отделение самого контента от представления этого контента на экране (дизайна сайта) и появление систем управления Web-контентом (они будут рассматриваться ниже). Надо отметить, что такое отделение не всегда возможно, поскольку существуют законы композиции, которые определяют восприятие человеком художественных полотен, фотографий, печатных изданий. Экран монитора в данном случае тоже можно рассматривать как «картинную плоскость». Законы, по которым строится, художественное полотно известны и один из принципов этого построения – «золотое сечение». Золотое сечение (читайте статью на сайте www.photoline.ru) . http://photoline.ru/tcomp1.htm
В известной мере принцип «золотого сечения» работает и для экрана монитора. По крайней мере, эти особенности человеческого восприятия надо учитывать при разработке дизайна сайта и, именно поэтому, не всегда контент можно отделить от дизайна. Дизайн сайта как и многое другое подвержен влиянию моды и зависит от вкусов заказчика и разработчика Web-сайта. И это часто бывает предметом серьезных разногласий. Поэтому, как правило, решение по выбору дизайна должен принимать один человек, который вызывает
|
|
Курс "Контент-инжиниринг",
editor@wdigest.ru. |