AXForum  
Вернуться   AXForum > Прочие обсуждения > forum.mazzy.ru > Полезные ссылки
All
Забыли пароль?
Зарегистрироваться Правила Справка Пользователи Сообщения за день Поиск Все разделы прочитаны

 
 
Опции темы Поиск в этой теме Опции просмотра
Старый 17.01.2005, 12:06   #1  
mazzy is offline
mazzy
Участник
Аватар для mazzy
Лучший по профессии 2015
Лучший по профессии 2014
Лучший по профессии AXAWARD 2013
Лучший по профессии 2011
Лучший по профессии 2009
 
29,472 / 4494 (208) ++++++++++
Регистрация: 29.11.2001
Адрес: Москва
Записей в блоге: 10
Технология Extensible Markup Language стала практически универсальным средством обмена информацией в онлайне. Но все чаще можно услышать признание, что за преимущества XML подчас приходится платить снижением производительности.

...

Проблема в следующем: сейчас стандарт XML предписывает хранить информацию в виде текста. Это означает, что XML-документ, такой как заказ-наряд или веб-страница, может легко воспринять человек или «считать» машина — при помощи многочисленных редакторов текста или XML-парсеров.

Но из-за тенденции XML к созданию очень крупных файлов возникают проблемы производительности. Отчасти причина в требовании, чтобы каждый элемент XML-документа помечался текстовыми метками. К тому же основанные на XML протоколы, называемые веб-сервисами, также генерируют значительный XML-трафик.

«XML не только многословен, но и чересчур избыточен с точки зрения пространства, приходящегося на единицу передаваемых полезных данных, — утверждает Джефф Лам, главный технолог компании Leader Technologies, где XML интенсивно используется для проведения телеконференций и где убеждены, что нужно что-то менять.

Основным кандидатом на роль средства, способного ускорить работу XML, служит технология, называемая бинарным XML, которая требует использования нового формата, компрессирующего XML-передачи.

Sun Microsystems инициировала проект open source Fast Infoset Project, основанный на бинарном XML, а ответственная за XML организация по стандартизации World Wide Web Consortium (WC3) сформировала рабочую группу Binary Characterization Working Group, которая займется переводом XML в двоичный формат.

Подробнее...
http://zdnet.ru/?ID=474189
__________________
полезное на axForum, github, vk, coub.
Старый 17.01.2005, 13:54   #2  
Alks is offline
Alks
Участник
 
336 / 41 (2) +++
Регистрация: 23.07.2004
Адрес: г. Новокузнецк
Ну наконец то на это обратили внимание в широкой общественности.
Действительно так и есть - XML черезчур раздувает объемы данных, непомерно усложняет парсинг файла с данными (попробуйте ка написать собственный парсер, с поддержкой всего функционала, расписанного на сотне страниц мелкого технического текста. ха! ). Ну и т.д. и т.п.
Кстати бинарные древовидные хранилища данных появились очень давно хотя бы в том же Windows в виде т.н. Structured File Storage (Compound Files), в которых данные хранятся в виде коллекций хранилищ и потоков бинарных данных в этих хранилищах. Эта технология знакома нам по файлам с расширением doc, xls, pps, mdb, т.е. другими словами - почти все файлы продктов MS Office и даже.... 1Cv7.MD
Однако та технология тяжеловесна и ориентирована на Win, а вот бинарный XML - то самое что нам нужно.
Старый 17.01.2005, 14:06   #3  
Maxim Gorbunov is offline
Maxim Gorbunov
Administrator
Соотечественники
Лучший по профессии 2009
 
2,483 / 645 (26) +++++++
Регистрация: 27.11.2001
Адрес: Dubai, UAE
Однако, таким образом будет потеряно одно из качеств XML, которое было заложено в него еще при разработке: будет потеряна возможность чтения XML-документов человеком.
__________________
Not registered yet? Register here!
Have comments, questions, suggestions or anything else regarding our web site? Don't hesitate, send them to me
Старый 17.01.2005, 14:11   #4  
Alks is offline
Alks
Участник
 
336 / 41 (2) +++
Регистрация: 23.07.2004
Адрес: г. Новокузнецк
Цитата:
Сообщение от Maxim Gorbunov
Однако, таким образом будет потеряно одно из качеств XML, которое было заложено в него еще при разработке: будет потеряна возможность чтения XML-документов человеком.
А собственно зачем нужна эта возможность?
По моему это совершенно бесполезное качество.
В крайнем случае можно сделать редактор bin-XML наподобие редактора реестра.
Старый 17.01.2005, 15:20   #5  
Dzemon is offline
Dzemon
Moderator
 
1,247 / 12 (3) ++
Регистрация: 09.09.2004
Я вот уже год обмениваюсь с региональными представительствами (1С) посредством XML-файлов. Избыточность огромная, спасает только RAR. Причем просматривать, а тем более править гиганский XML файл - задача совершенно пошлая. Но даже маленький файл просматривать удобнее в специальной программе, умеющей управлять его структурой. Поэтому невозможность просматривать этот файл Notepad-ом не есть серьезный аргумент.
Старый 17.01.2005, 15:55   #6  
Maxim Gorbunov is offline
Maxim Gorbunov
Administrator
Соотечественники
Лучший по профессии 2009
 
2,483 / 645 (26) +++++++
Регистрация: 27.11.2001
Адрес: Dubai, UAE
Цитата:
Сообщение от XML.com: A Technical Introduction to XML
XML Development Goals
...
6. XML documents should be human-legible and reasonably clear. If you don't have an XML browser and you've received a hunk of XML from somewhere, you ought to be able to look at it in your favorite text editor and actually figure out what the content means.
...
9. XML documents shall be easy to create. Although there will eventually be sophisticated editors to create and edit XML content, they won't appear immediately. In the interim, it must be possible to create XML documents in other ways: directly in a text editor, with simple shell and Perl scripts, etc.
В общем, бинарный XML - это уже не XML. Как геометрия Лобачевского и Эвклида.
__________________
Not registered yet? Register here!
Have comments, questions, suggestions or anything else regarding our web site? Don't hesitate, send them to me
Старый 17.01.2005, 16:03   #7  
Dzemon is offline
Dzemon
Moderator
 
1,247 / 12 (3) ++
Регистрация: 09.09.2004
Да бросьте! Первая база данных RDB тоже состояла из текстовых файлов, а теперь как выглядят реляционные базы? Со временем объем информации убивает простоту просмотра.
Старый 17.01.2005, 17:51   #8  
Maxim Gorbunov is offline
Maxim Gorbunov
Administrator
Соотечественники
Лучший по профессии 2009
 
2,483 / 645 (26) +++++++
Регистрация: 27.11.2001
Адрес: Dubai, UAE
Да я же не об этом!
Я просто пытаюсь обратить Ваше внимание на то, что возможность чтения XML-документов с помощью обычных текстовых редакторов закладывалась на уровне задач, которые должны быть решены в процессе создания этого языка. И она не является менее важной, чем, например, задача совместимости с SGML.
__________________
Not registered yet? Register here!
Have comments, questions, suggestions or anything else regarding our web site? Don't hesitate, send them to me
Старый 17.01.2005, 19:47   #9  
Alks is offline
Alks
Участник
 
336 / 41 (2) +++
Регистрация: 23.07.2004
Адрес: г. Новокузнецк
Цитата:
Сообщение от Maxim Gorbunov
Да я же не об этом!
Я просто пытаюсь обратить Ваше внимание на то, что возможность чтения XML-документов с помощью обычных текстовых редакторов закладывалась на уровне задач, которые должны быть решены в процессе создания этого языка. И она не является менее важной, чем, например, задача совместимости с SGML.
а пример практичности сей идеи в студию?

ну или просто - люди, которым приходится по рациональным причинам в нотепаде править SGML-like XML, отзовитесь. 8()
Старый 17.01.2005, 20:04   #10  
Vadik is offline
Vadik
Модератор
Аватар для Vadik
Лучший по профессии 2017
Лучший по профессии 2015
 
3,631 / 1849 (69) ++++++++
Регистрация: 18.11.2002
Адрес: гражданин Москвы
Цитата:
Сообщение от =A=L=X=
ну или просто - люди, которым приходится по рациональным причинам в нотепаде править SGML-like XML, отзовитесь. 8()
Ну я правил, правда не в notepad, а в far-е

Был период, когда часто правили много мелких файлов. Специализированные редакторы уже были, но править файлы руками оказалось быстрее
__________________
-ТСЯ или -ТЬСЯ ?
Старый 17.01.2005, 20:44   #11  
Alks is offline
Alks
Участник
 
336 / 41 (2) +++
Регистрация: 23.07.2004
Адрес: г. Новокузнецк
Цитата:
Сообщение от Vadik
Цитата:
Сообщение от =A=L=X=
ну или просто - люди, которым приходится по рациональным причинам в нотепаде править SGML-like XML, отзовитесь. 8()
Ну я правил, правда не в notepad, а в far-е

Был период, когда часто правили много мелких файлов. Специализированные редакторы уже были, но править файлы руками оказалось быстрее
А в чём была сущность этих исправлений?
Не оказалось ли в последующем исправить причину неточностей, чем заниматься ручной работой?
Согласитесь ли вы снова заниматься подобными вещами?
Старый 17.01.2005, 21:15   #12  
Vadik is offline
Vadik
Модератор
Аватар для Vadik
Лучший по профессии 2017
Лучший по профессии 2015
 
3,631 / 1849 (69) ++++++++
Регистрация: 18.11.2002
Адрес: гражданин Москвы
Цитата:
Сообщение от =A=L=X=
Не оказалось ли в последующем исправить причину неточностей, чем заниматься ручной работой?
Это как анекдот про зайца, которого при желании даже можно научить курить Наловчились достаточно быстро и с вполне приемлимым процентом ошибок.
__________________
-ТСЯ или -ТЬСЯ ?
Старый 18.01.2005, 05:45   #13  
Alks is offline
Alks
Участник
 
336 / 41 (2) +++
Регистрация: 23.07.2004
Адрес: г. Новокузнецк
Да не - это всё равно несерьезно. Не для того делаются форматы файлов данных, чтобы в них ручками копались, исключением пожалуй являются конфигурационные файлы настроек под юниксоидными программами.
Да и бинарные файлы всегда будут компактнее по размерам в разы, в десятки раз (!) быстрее парсится и проще в программном интерфейсе, чем текстовые. И разговоры о том что у нас винты скоро будут терабайтные и процессоры десятигигагерцовые и следовательно это несущественно, лажа, т.к. и на терабайтных винтах и десятигигагерцовых процессоров бинарные файлы будут в разы компактнее и в десятки раз быстрее. .
Старый 18.01.2005, 12:49   #14  
Ruff
Гость
 
n/a
Не удержусь, выступлю-таки в защиту XML.

Во-первых, согласен с Максимом в том, что при разработке формата XML ставились несколько иные цели, нежели передача двоичных данных в компактном виде. Для этого существует огромное число двоичных форматов, в том числе позволяющих структурировать данные по аналогичному с XML принципу - например, тот же RIFF (*.avi, *.wav, *.ani, и т.п.) с его вложенными блоками (chunks) вместо тэгов, или Structured File Storage, о котором писал выше =A=L=X=.

Во-вторых, возможность ручной правки очень даже полезна в случае испорченных или частично потерянных данных. Даже самый супер-мега-крутой редактор любого бинарного формата можно ввести в заблуждение, подсунув ему хитро "подпорченный" файл. В лучшем случае он просто обругает вас и откажется работать не со "своим" форматом. Что будет в худшем случае - см. следующий абзац. Таким образом, одно из преимуществ текстовых форматов (в т.ч. XML) состоит в возможности использовать в экстренных случаях естественный интеллект человека вместо создания искусственного интеллекта.

И в-третьих, нельзя забывать о безопасности, с точки зрения которой недвоичные форматы заметно выигрывают. Всем известны многочисленные дыры, найденные в архиваторах, графических вьюерах и т.д., позволяющие путем подсовывания кривых данных исполнять на машине произвольный код (содержащийся в этих самых данных). Речь о червях, троянцах и иже с ними. В XML-формат засунуть вирус (а главное - заставить его выполниться) практически невозможно. Одним из исключений являются макро-вирусы, но, ИМХО, ничего более идиотского, чем макрос в теле документа придумать было нельзя. Хочешь расширить функционал - пиши плагины... Но это уже вопрос философский. А что касается XML, то, по-моему, только в пьяном бреду можно написать для него парсер, который на некорректных данных вызывал бы утечки памяти или переполнение стека, то есть потенциальную угрозу безопасности.
Поэтому утверждение =A=L=X= о том, что "бинарные файлы... проще в программном интерфейсе, чем текстовые", считаю очень даже спорным, ведь кроме простоты чтения/записи есть еще надежность и отказоустойчивость.

Так что еще раз соглашусь с Максимом Горбуновым: "бинарный XML - это уже не XML", а нечто другое, выполняющее совсем иные функции.
Старый 18.01.2005, 19:17   #15  
Alks is offline
Alks
Участник
 
336 / 41 (2) +++
Регистрация: 23.07.2004
Адрес: г. Новокузнецк
Цитата:
Сообщение от Ruff
.
Цитата:
Во-первых, согласен с Максимом в том, что при разработке формата XML ставились несколько иные цели, нежели передача двоичных данных в компактном виде.
Вам это цель нужна была когда нибудь? Мне - нет.

Цитата:
Таким образом, одно из преимуществ текстовых форматов (в т.ч. XML) состоит в возможности использовать в экстренных случаях естественный интеллект человека вместо создания искусственного интеллекта.
Поверьте мне - оно того не стоит. Ппроще перезаписать болванку за 20 рублей, чем расходовать естественный интеллект человека за 500 р/в час.

Цитата:
это уже вопрос философский. А что касается XML, то, по-моему, только в пьяном бреду можно написать для него парсер, который на некорректных данных вызывал бы утечки памяти или переполнение стека, то есть потенциальную угрозу безопасности.
В пьяном бреду для XML парсер точно не напишешь - только на то чтобы написать модуль проверяющий соответсвие XML-документа заявленному формату через dtd вам потребуется потратить ОЧЕНЬ много человеко-часов, совершенно неоправданно.

Цитата:
потому утверждение =A=L=X= о том, что "бинарные файлы...  проще в программном интерфейсе, чем текстовые", считаю очень даже спорным, ведь кроме простоты чтения/записи есть еще надежность и отказоустойчивость.
Извините, но программоустойчисовть и простота программного интерфейса - это совсем разные вещи. )))))) Вот вы пользуетесь RAR или ZIP? А вам известно что один неверный бит в архиве полностью разрушает эти самые архивы на сотни мегабайт размером???? Так вы всё еще пользуетесь раром или зипом или предпочитаете хранить свои данные в тексте?

Цитата:
Так что еще раз соглашусь с Максимом Горбуновым: "бинарный XML - это уже не XML", а нечто другое, выполняющее совсем иные
А я тожесоглашусь с ним. XML - это "fire and motion". А аналог бинарного XML я писал раз 5 за своё программерское детство, еще в BP-паскале.
Старый 19.01.2005, 09:00   #16  
Ruff
Гость
 
n/a
Цитата:
Ппроще перезаписать болванку за 20 рублей
А причем здесь болванка? Хранение данных - это совсем не из той оперы. XML задумывался прежде всего для передачи по сети. Это "живые" данные, но никак не мертвый груз.
Цитата:
только на то чтобы написать модуль проверяющий соответсвие XML-документа заявленному формату через dtd вам потребуется потратить ОЧЕНЬ много человеко-часов, совершенно неоправданно
Так все же уже написано... Поэтому он так и популярен.

А рар-ом и зип-ом я на самом деле уже почти не пользуюсь (с тех пор, как появились CD-RW и DVD-RW). И, кстати, один неверный бит всегда легче локализовать, чем несколько неверных бит Вспомните теорию помехоустойчивых кодов. Поэтому, иногда вы можете и не догадываться о существовании ошибки в данных. Это так, к слову. Разумеется ни о какой помехоустойчивости текстовых данных речи не идет - это должно обеспечиваться протоколами нижнего уровня.

И на последок. Я не пытаюсь утверждать, что двоичные данные - это зло, а текстовые - forever . Я говорю, что и тот и другой способы имеют право на существование. Просто надо отделять мухи от котлет. В самом первом постинге mazzy была приведена цитата одного товарища, рассказывающего, как неудобно использовать XML для телеконференций. И из этого он сделал вывод, что "надо что-то менять". Если так рассуждать, то когда кто-то догадается засунуть в принтер туалетную бумагу, чтобы напечатать фотографию, то после его неудачи нужно ВСЮ туал. бумагу делать из картона?

В-общем, текстовый XML должен остаться по-любому... По крайней мере еще несколько лет, пока hardware не выйдет на принципиально новый уровень.

P.S. =A=L=X=, а что такое "программоустойчивость"? Опечатка?
Старый 19.01.2005, 09:57   #17  
Alks is offline
Alks
Участник
 
336 / 41 (2) +++
Регистрация: 23.07.2004
Адрес: г. Новокузнецк
Цитата:
А причем здесь болванка? Хранение данных - это совсем не из той оперы. XML задумывался прежде всего для передачи по сети. Это "живые" данные, но никак не мертвый груз.
Для сети размер файла - это как раз очень важный параметр. Когда выгрузка справочника из 1С в XML занимает на диске 100 мегабайт, а собственно сама dbf-ка с этим справочником - 10 мегабайт, можно задуматься над тем что лучше передавать по сети - текст или бинарные данные. XML, имхо, уместен в данном случае когда объёмы данных невелики.
Тут еще кстати я замечу что эта проблема актуальна еще и для HTML - HTML тоже очень избыточен в своих размерах, и к сожалению в протокол HTTP не заложили возможность хотя бы сжимать передаваемый поток данных тем же общедоступным zlib-ом, это чувствуют все кто по выделенке сидят в веб-чатах, по сравнению с той же аськой.

Цитата:
Так все же уже написано... Поэтому он так и популярен.
Да знаю, я сам пользовался ком-объектом XMLDOM из IE 4.0 (кстати аксапта именно через XMLDOM и работает), и всё работало, но когда программу запустили на машине где стоял IE 5.0, оказалось что в ней XMLDOM "слегка изменил интерфейс по умолчанию", и программа рухнула. Пришлось быть осторожными с версиями интерфейсов - получать конкретный COM конкретной версии. Так тут тоже не всё безоблачно.

Цитата:
И на последок. Я не пытаюсь утверждать, что двоичные данные - это зло, а текстовые - forever .
Да и я тоже не утвержаю. Просто я на самом деле встречал очень мало задач, которые бы требовали применения XML - а применять столь сложную идеологически технологию по поводу и без повода, имхо, не есть гуд.

Цитата:
В-общем, текстовый XML должен остаться по-любому... По крайней мере еще несколько лет, пока hardware не выйдет на принципиально новый уровень.
Да он останется и через много лет после выхода на новый уровень... Ибо он удобен когда нужно хранить иерархические данные (древовидные) в текстовом виде. (пример - конфигурационные файлы, и размер незначителен и удобно править ручками)

Цитата:
P.S. =A=L=X=, а что такое "программоустойчивость"? Опечатка?
Да, это я уже мыслями был на два слова вперед в слове "программирование", когда руки еще печатали "отказоустойчивость".
Старый 28.01.2005, 17:07   #18  
mazzy is offline
mazzy
Участник
Аватар для mazzy
Лучший по профессии 2015
Лучший по профессии 2014
Лучший по профессии AXAWARD 2013
Лучший по профессии 2011
Лучший по профессии 2009
 
29,472 / 4494 (208) ++++++++++
Регистрация: 29.11.2001
Адрес: Москва
Записей в блоге: 10
А вот и стандарты
http://www.w3.org/TR/xop10/
http://www.w3.org/TR/soap12-mtom/

вот пресс-релиз
http://www.w3.org/2005/01/xmlp-pressrelease
__________________
полезное на axForum, github, vk, coub.
 

Опции темы Поиск в этой теме
Поиск в этой теме:

Расширенный поиск
Опции просмотра

Ваши права в разделе
Вы не можете создавать новые темы
Вы не можете отвечать в темах
Вы не можете прикреплять вложения
Вы не можете редактировать свои сообщения

BB коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.
Быстрый переход

Рейтинг@Mail.ru
Часовой пояс GMT +3, время: 11:30.