воскресенье, 23 мая 2010 г.

Теория Мирового копипаста

Сегодня ломал себе голову насчёт копипаста.

Что есть уникальный текст?

Так про яндекс я не думаю, мыслю только о Google.

Мы знаем что писать текст нужно в районе 500 символов. Думаю потому что нужно именно столько текста чтобы гугл понял уникальный это текст или нет.

Потому что сами подумайте если бы каждый пост состоял из одного предложения типа “Привет” или “Как дела?” то он бы был не уникальным. Даже если вы этот текст писали явно сами и ниоткуда его не копировали :)

Почему нельзя использовать синонимы? Говорят что гугл понимает синонимы за счёт редко встречающися слово сочетаний. Типа “Табуретка переплыла асфальт” или типа того (хотя это уже похоже не на синонимайзер – а бредо генератор :).

Но! у меня есть блоги в топе которые наполненые текстом переведёным первого языка, на второй и потом снова на первый. То есть получается опять же это почти что синонимайзер. Кароче тупо говоря синонимы использовать можно! И получается единственый минус от такого текста это трудное восприятие человека. Текст становится не читаем.

Есть ещё цепи маркова. Насколько я знаю разные части текста перемешиваются между собой. И я точно незнаю палится ли он Гуглом или нет. Я буду считать что палится. И если он палится… то я думаю это происходит так:

Гугл разбивает весь текст на проиндексированой странице где каждое предложение становится элементом массива и после их сравнивает.

Как то сравнимает… я даже и представлять это не берусь там масштабы нереальные.

Давайте подумаем дальше.

У меня есть два вопроса на которые я незнаю ответа.

Что если одна страница будет состоять из кратких новостей других новостей.

То есть например есть сайт источник на котором 10 новостей.

Мы берём каждое первое предложение всех этих 10 новостей и объединяем в одну при этом само собой оформляем каждое предложение заголовком.

То есть получится 1 новость состоящая из 10 кратких.

Такой текст будет уникальным? Насчёт читаемости я думаю она будет на высоте. Но мне кажется что ещё и такой текст не будет иметь своего ключевого слова. Ведь это будет набор осмысленых предложений, полезных для человека, но поисковик не сможет определить саму суть этого текста (ключевик по которому выводить текст).

Если мы добавим к такому тексту ключевик сами, то этот текст перестанет быть читаемым.

Есть ещё одна мысль которая мне пришла в голову. Я не говорю что больше вариантов генерации текста нет, просто про других сейчас я не могу вспомнить.

Я сегодня потупил над PHP и написал простой генератор. Сделал чтобы он сохранял в формате Zerber (чтобы потом было удобно сразу сабмитеть)

Главная новость Asus 100

Есть у меня кое-что о чём должен знать каждый. Я не буду много писать. Вы хотите себе Asus 100? Что думают конкуренты о Asus 100. Создатели гении. Потрясно выглядит. Я не видел ещё описания Asus 100.

Крутой Pioneer 500

Хочу сегодня написать об интересной новости. От увиденного мысли спутались. Вы захотите его! Мне всё равно что думают другие о Pioneer 500. Разработчики делали с любовью Pioneer 500. Я думаю у Pioneer 500 потрясающий дизайн. Мне кажется я первый пишу о Pioneer 500 в интернете. А вы уже думали о Pioneer 500? Думаю себе тоже его купить.

Вот примеры текста. Я его никак не редактировал. Думаю выглядит вполне сносно. Правда это только набросок, но думаю в итоге текст стнет более читаемым.

Сейчас слушаю: Element Eighty - Rabies ..:Альбом: Element Eighty +Shooter:..

Комментариев нет: