![]() |
|
IT и Связь Обсуждение "айтишных" вопросов и средств связи |
![]() |
|
Опции темы | Опции просмотра |
![]() |
#1 |
Просто Зануда
|
![]()
Никто не встречался с инструментарием, который мог бы посмотреть на колонку в табличке, в которой хранится XML, и, проанализировав значения в этой колонке для заданного подмножества записей, reverse engineer XML схему для хранимого XML'я?
Так же подойдёт инструмент, которому на вход можно дать набор XML -файлов, по которым он сделает XML схему.
__________________
The misuse of language induces evil in the soul © Socrates ![]() Последний раз редактировалось tadpole, 27.11.2008 в 13:17. Причина: Добавлено сообщение |
![]() |
![]() |
Зарегистрируйтесь или войдите под своим именем, чтобы спрятать этот рекламный блок |
![]() |
#3 | |
Просто Зануда
|
![]() Цитата:
Однако вопрос был другой - знает ли кто-то конкретный инструментарий, способный решить поставленную задачу?
__________________
The misuse of language induces evil in the soul © Socrates ![]() |
|
![]() |
![]() |
![]() |
#5 |
Активный Участник
|
![]()
Не думаю что такие существуют, т.к. содержимое/данные в XML-файле не подлежат простому анализу. Это по-сути, как в математике, задача вывода формулы прогрессии по начальному набору елементов, что в переводе на форматирование в XML просто невозможно.
|
![]() |
![]() |
![]() |
#6 |
Просто Зануда
|
![]()
Мне не надо анализировать данные, только структуру вытащить.
__________________
The misuse of language induces evil in the soul © Socrates ![]() |
![]() |
![]() |
![]() |
#7 |
My name is Exaybachay
|
![]()
я думаю не надо замыкаться на сиквеле. нужна любая софтина жрущая много хмл файлов и вырабатывающая _какую_то_ схему которой бы эти файлы соответствовали.
проблема конечно в том что такая схема будет не единсвтенной, и требования типа наименьшая, наибольшая и т.п. не подходят, потому что наименьшая тривиальна, а наибольшей не существует. вообще задача теоретически интересна. особенно определение практически полезных критериев с помощью которых можно было из всех возможных схем выбрать наиболее полезную. с решениями не сталкивался, впрочем. KaraNagai добавил 27.11.2008 в 15:51 подумал - по-простому схема должна описывать лишь все возможные элементы и атрибуты, не накладывая ограничений на количество первых и значение последних в каждом контексте. тулзу можно написать весьма просто, но вот вопрос будет ли такая схема полезна? и какова вероятность что во всех примерах просто не встретился какой-то элемент или атрибут, который встретится в новых примерах, к которым эта схема будет применяться?
__________________
митьки никого не хотят победить Последний раз редактировалось KaraNagai, 27.11.2008 в 14:51. Причина: Добавлено сообщение |
![]() |
![]() |
![]() |
#8 |
Просто Зануда
|
![]()
Антон, ты смотришь на задачу слишком широко
![]() У меня же конкретная потребность. Есть БД, спроектированная Java-программистами, которые считают, что БД - это data dump. Поэтому они в таблицах определяют колонки ID, LAST_UPDATED и XML. И в последней прячут все атрибуты. Мне надо как-то просто и быстро понять, какие атрибуты бывают запрятаны в этом XML'е, какие там всегда есть, а какие не всегда и т.п. Очевидно, что для этого XML'я существует вполне определённая схема. Может, правда, не физически, но в головах этих гениев. К моему сожалению и их счастью, доступа к этим "разработчикам" у меня сейчас нет и в отведённых на анализ временных рамках не предвидется. Поэтому хочется готовый инструмент, который посмотрит на набор XML instances (в БД или не в БД - это уже не важно, как ты правильно заметил) и нарисует схему для данного набора. tadpole добавил 27.11.2008 в 16:03 Я могу потерпеть до обеда в будущий понедельник ![]() Для меня сейчас - очень.
__________________
The misuse of language induces evil in the soul © Socrates ![]() Последний раз редактировалось tadpole, 27.11.2008 в 15:03. Причина: Добавлено сообщение |
![]() |
![]() |
![]() |
#9 |
Спам-робот
|
![]()
Сложность результата зависит от того, насколько детально хочется прорабатывать схему. Например, хочется ли распознавать типы данных - или достаточно все считать стрингами. Считать ли min/max - или все повторения тупо объявлять 1-unlimited. И т.д.
Каранагай прав, если не углубляться в подобные мелочи, оно пишется на той же жабке довольно шустро. Разумеется, к СУБД привязывать смысла нет. На входе текстовый стрим, на выходе стрим. Unix way... |
![]() |
![]() |
![]() |
#10 | ||
Просто Зануда
|
![]() Цитата:
Цитата:
![]()
__________________
The misuse of language induces evil in the soul © Socrates ![]() |
||
![]() |
![]() |
![]() |
#11 | |
Заслуженный Участник
|
![]() Цитата:
загрузите ваш XML и откройте его как XSD файл (XML Schema Definition (XSD)) |
|
![]() |
![]() |
![]() |
#12 |
Просто Зануда
|
![]()
А он умеет больше одного за раз? У меня десятки и сотни тысяч документов.
__________________
The misuse of language induces evil in the soul © Socrates ![]() |
![]() |
![]() |
![]() |
#13 |
Спам-робот
|
![]()
OFFTOP: Ненавижу XML
![]() А поле куда он слит - текстовое или XML типа? Может Оракл сам оттуда вытянет схему?
__________________
My Church is Black... |
![]() |
![]() |
Зарегистрируйтесь или войдите под своим именем, чтобы спрятать этот рекламный блок |
![]() |
#14 |
Просто Зануда
|
![]()
Не, я XML люблю. Если правильно использован. А вот людей, которые допускают Java-программистов к проектированию реляционных БД, да, не очень люблю
![]() CLOB. Использовать XMLType с привязкой схем Java-программисты не догадались, к сожалению.
__________________
The misuse of language induces evil in the soul © Socrates ![]() |
![]() |
![]() |
![]() |
#15 |
Пенсионер всея Ирландея
|
![]()
Денис,
алгоритм примерно такой: берешь первую строку за этолон и всасываешь в дом, для каждой последующей строки сравниваешь дом с эталоном, если в эталоне не существует - добавляешь в эталон, как резульлтат получаешь xml содержаший все, что только возможно ну и там рющечки всякие, типа длину сравнивать/увеличивать походу тип & etc
__________________
невозможно испугать санкциями того, кому похер, так,что санкции против меня на этом форуме, мне феерически похер |
![]() |
![]() |
![]() |
|
|
![]() |
||||
Тема | Автор | Раздел | Ответов | Последнее сообщ. |
Looking for job from May (AutoCAD technician), engineering... | inna65 | Работа в Ирландии | 6 | 28.03.2008 11:03 |
engineering (что выбрать) | AlesKlar | Образование | 19 | 21.01.2008 18:28 |
Civil Engineering Reference | dzher | Само приползло | 0 | 26.07.2007 12:16 |
Industrial Engineering. Какой ВУЗ выбрать? | Agent | Образование | 6 | 04.03.2007 10:47 |
Buyer tries to reverse sale | werewolf | Автотранспорт | 73 | 24.01.2007 17:30 |