erazel Мне кажется бред. Если в html тупо засунуть <,> через спец символы, то они тоже примитивно отсекаются. Или через тэг кода - то ещё проще. В любом случае - вывод на монитор побольше, фотка и файнридер. Элементарно. Так что если человек сможет текст прочитать, то и скопировать - нет проблем. Вне зависимости от объема.
moty а все же как вы собираетесь отсекать теги от обычного текста? Отличие тега в том что он идет после < и до > но стоит эти два символа кинуть в текст как парсинг и затупит на том елементе. Базу тегов тоже не создашь так как их слишком много и они все разные. Вот и получаеться что если автор текса знает что его будут парсить то может наделать слишком много подлянок.
Цитата:
а все же как вы собираетесь отсекать теги от обычного текста?
Ненененене, ответьте мне лучше, какой это смысл отвечать что-то человеку, который даже не умеет пользоваться гуглом? А это вообще убило..:
Цитата:
Базу тегов тоже не создашь так как их слишком много и они все разные
_________________ Библиотеки Windows - Мы заставим ваши папки тормозить!
Member
Статус: Не в сети Регистрация: 11.03.2009 Откуда: Санкт-Петербург
Как уже говорили, можно делать текст в виде фоток, но тогда он во-первых, не будет индексироваться поисковиками, а во-вторых, от файнридера опять же не защитит. Так что лучшая защита текста - капча: #77
_________________ Личная коллекция видеокарт на http://vccollection.ru/ Команда star-citizen.ru. Самые свежие материалы о Star Citizen.
H_Rush Угу, и динамическая капча, да так чтобы цифры через вычисления, а буквы через ребусы. А к одинаковой капче можно и поднаписать, если очень надо =)
Member
Статус: Не в сети Регистрация: 25.01.2006 Откуда: Тернополь(Укр.)
moty писал(а):
Ненененене, ответьте мне лучше, какой это смысл отвечать что-то человеку, который даже не умеет пользоваться гуглом? А это вообще убило..:
А если без лишних понтов и на конкретных примерах? Хотя бы в виде логики работы скрипта? Кидаться умными фразами каждый может. То что по шаблону можна вычислить тег это ясно, но шаблон можна легко обманунуть. Вот как вы собираетесь отсекать теги от отбычного текста? По каким критериям вы будете определять текс это или тег?
Ненененене, ответьте мне лучше, какой это смысл отвечать что-то человеку, который даже не умеет пользоваться гуглом? А это вообще убило..:
А если без лишних понтов и на конкретных примерах? Хотя бы в виде логики работы скрипта? Кидаться умными фразами каждый может. То что по шаблону можна вычислить тег это ясно, но шаблон можна легко обманунуть. Вот как вы собираетесь отсекать теги от отбычного текста? По каким критериям вы будете определять текс это или тег?
цикл Eсли < Можно начать записывать в переменную маску удаления любого вида и любой сложности. Регулярка на валидность тега (латиница, макс символов, макс допустимые символы, пробел ) если невалиден - брейк. // необязательно быстренькое сравнение с листом тегов. если невалиден - брейк // конец необязательного. редактирование цикл с регуляркой для выявления параметров тега. регулярка проверяет правописание пары название параметра - значение. //необязательное: 1. сравнение допустимости заголовков параметров с листом всех параметров. 2. проверка всех возможных значений параметров по регулярке. 3. запись маски. // конец необязательного. поиск > дополнение маски Удаление по маске. Дальше, пока не еоф.
Такой скрипт удалит весь валидный html. Т.е. например из "важная информация <font color="vazhnaja_informacija">инф </font></invalid_tag>" можно получить "важная информация vazhnaja_informacijaинф </invalid_tag>" Можно там... реализовать удаление даже незакрытых тегов - делать всё, пока валидные параметры не сменятся на кашу остального текста.... проверять ессно регуляркой Опытный программист может тотально изменить алгоритм, и вообще сделать всё по другому. Но вообще это глупость, ибо инструмент, который не только отделяет валидный html от невалидного, но и использует его - браузер.
_________________ Библиотеки Windows - Мы заставим ваши папки тормозить!
Последний раз редактировалось moty 21.11.2010 22:32, всего редактировалось 1 раз.
А если без лишних понтов и на конкретных примерах?
жизненный пример- текстовый редактор с подсветкой html тегов у него же как то получается отделять их от остального текста... а если даже не знать регулярные выражения, а просто погуглить то практически первая ссылка выведет на выражение вида (<.*?>), которое и должно в большинстве случаев соответствовать html тегам, если в тексте нет извращений.
Member
Статус: Не в сети Регистрация: 25.01.2006 Откуда: Тернополь(Укр.)
Сенкс, moty. Вот именно это я и хотел увидеть.
Цитата:
быстренькое сравнение с листом тегов.
Я вот про это говорил что тегов слишком много и всех может в базе небыть. Хотя еще неясно какую базу тегов использовать. А вообще есть база тегов? Ну может какие-то спецификации HTML 5.x и все такое.
Member
Статус: Не в сети Регистрация: 06.10.2008 Откуда: Тула, Н-ск Фото: 5
erazel берётся студент второкурсник, 500р и 2 дня, через 2 дня вы получаете чистый голый текст без тегов, ещё и форматированный. От юзверя не спасает никакая защита, так что не морочьтесь с этим даже. Если не хотите, чтобы текст копировали, не выкладывайте его в свободный доступ.
_________________ Пятнадцать человек на сундук мертвеца, Йо-хо-хо, и бутылка рому! Пей, и дьявол тебя доведет до конца. Йо-хо-хо, и бутылка рому!
Member
Статус: Не в сети Регистрация: 08.06.2008 Откуда: Kyiv, UA
Никак. Ибо вариантов скопировать тьма. Правда на счет удаления тегов не соглашусь, при кривой разметке (которая как ни странно будет нормально отображаться), можно встретить что нить вроде <div><div <span>some text</span></div> и поди потом разбирай такое. Количество открывающих и закрывающих тегов на некоторых сайтах не совпадает.
Я вот про это говорил что тегов слишком много и всех может в базе небыть. Хотя еще неясно какую базу тегов использовать. А вообще есть база тегов? Ну может какие-то спецификации HTML 5.x и все такое.
Есть чёткие стандарты, как html должен выглядеть, какие теги в нём должны быть теги, а какие нет, стандарты ставит World Wide Web Consortium W3, они в скучных документациях описывают каждый байт стандартов, иначе-бы каждый сайт писался-бы на "своём" языке и отобразить его в браузере было-бы невозможно. Ну а тегов не так уж много http://www.w3schools.com/tags/default.asp в 5-м добавилось.
Цитата:
при кривой разметке (которая как ни странно будет нормально отображаться), можно встретить что нить вроде <div><div <span>some text</span></div>
я писал:
Цитата:
Можно там... реализовать удаление даже незакрытых тегов - делать всё, пока валидные параметры не сменятся на кашу остального текста.... проверять ессно регуляркой
_________________ Библиотеки Windows - Мы заставим ваши папки тормозить!
Сейчас этот форум просматривают: Google [Bot], Gromwerg, Vik321 и гости: 22
Вы не можете начинать темы Вы не можете отвечать на сообщения Вы не можете редактировать свои сообщения Вы не можете удалять свои сообщения Вы не можете добавлять вложения