Arama butonu
Bu konudaki kullanıcılar: 1 misafir
184
Cevap
24390
Tıklama
0
Öne Çıkarma
Yazı Dizisi 1 'ARAMA MOTORLARINA KAYIT' ;
M
20 yıl
Yarbay
Konu Sahibi

Merhaba arkadaşlar.

Gelişen teknoloji kuşkuşuz en büyük devrimini bilgisayar ve web Tasarımı alanlarında

gerçekleştirmiştir. Günümüzde sırf türkiyeden günde binlerce web sitesi aktifleniyor. Elbette bilgi

açısındna bizlere daha çok kaynak çıkmakla beraber hemen hemen her yeni gün bu kaynağa

ulaşım bir okadar zorlaşıyor. Özellikle google gibi büyük arama motorlarında en üstte çıkmak yada

sitemizi oraya eklemek elbette bilgiye ulaşımı kolaylaştıracaktır. Ziyaretçilerin bizi bulması için çok

öenmli olan bu konu hakkında eskiden bir araştırma yapmıştım. Aam son zamanlarda Özellikle DH

den bir çok kişi benim bildiklerimi öğrenmeye ve sitelerinin hiti artırmayı istiyorlar. buna dair bir çok

Pm, email ve özellikle MSN den bir çoğunuzla görüştüm. elimden geldiğince destek verdim. ama

galiba burada iyi bir rapor sunmak çok daha iyi olacak. Elimde eskiden olan dökümanı biraz

derleyip toplayıp burda sizlerle paylaşmaya karar verdim. Umarım memnun kalırsınız.. İlk olan ama

asla son olmayacal yazı dizime Google ' ye site eklemek olarak başlıyorum ..


-----------
YAZI DİZİSİ 1 - GOOGLE'DE YER ALMAK




Aslında google ve buna benzer arama motorlarında yer almak yada üst seviyeye çıkmak hiçde

okadar zor değil sadece yapmamız gereken bir kaç ayar var ve ben sizlere bu ayarları ayrıntılı

olarak anlatacam..

Öncelikle işe sayfamızdaki meta taglar ile başlayalım ..

Bu yazı hiçbir şey bilmeyen bir kişi baz alındığı için sadece gogole değil tüm meta tagları

anlatacam;


<META HTTP-EQUIV="Content-type" CONTENT="text/html; charset=iso-8859-1">
<META NAME="description" CONTENT="Konu">
<META NAME="keywords" CONTENT="kelime1, kelime2, kelime3, kelime4,kelime 5">
<META NAME="author" CONTENT="KapTan">
<LINK REV="made" href="mailto:info@hostinghizmeti.com">




Buraya kadar olan 5 satır klasik meta tag olup <head> .. </head> tagları arasında yer alır.

ziyaretçilerimize asla görünmeyen yazılar olup uygulama anaları şöyledir..

1.satırdaki tag sayfamızın hangi dilde yazıldığını gösterir. Türkçe karakter kullananlar için mutlaka

olması gereken bir tagdır.
2.satırdaki tag sayfamızın konusunu belirler.
3. satırdaki tag sayfamızın arama motorlarında bulunmasını istediğimiz anahtar kelimelerini

belirlememize yarar. Burda dikkat edilmesi gereken en faz 20 anahtar kelime tanımlamamız ve

aralarına virgül (,) koymmaız.
4. satırdaki tag sitenin adminini, 5. satırdaki tag ise o adminin aktif email adresini belirlememize

yarar..

Dediğimn gibi buraya kadar standart taglardır. Şimdide google için ekstra 2 tag yazalım ve bu

tagları yukarıdakilerin altına koyup sayfamıza ekleyelim..


<META NAME="ROBOTS" CONTENT="INCLUDE, FOLLOW">
<META NAME="revisit-after" CONTENT="1">

Burda 1. sıradaki tag google ve diğer arama motorlarının örümcek (robot) lerine sitemizi indexleme

kolaylığı sağlamakla birlikte 2. satırdaki 1 sayısı 1 haftada bir sitemizin güncellendiğini ve 1 hafta

sonra tekrar bu örümceğin sitemize gelmesi ve değişimi tekrar veritabanına eklemesi gerektiğini

gösterir. Ben burda temsilen 1 yazdım. Eğer siteniz çok sık güncellenen bir site değilse bu sayısı

3-4 yapmak en mantıklısı olacaktır.


Şimdi gelelim bu işin en önemli yerine. örümceğe yol göstermeye. öncelikle örümcek hakkında bilgi

vereyim size. Örümcek yada robot adıyla anılan bazı programlar vardır. Bu programlar direk arama

motorlarının veri tabanından gelirler. her gün milyonlarca siteyi gezer ve o sitedeki bilgileri alıp

veritabanına eklerler. Dolayısıyla google de yer almak için bu örümceği iyi bilmemiz gerekir.

Örümcek zararsızdır elbette ama örümceği iyi tanımak ona yol göstermek örümceğin rastgele

bilgiler alıp gitmesini engellemek de bizim görevimizdir. Bazı arama motorları örümcekleri önce

sizden onay ister. sizin ona izin verip vermediğinizi bilmek ister. işte bununda en basit ve etkili

çözümü robots.txt dosyasıdır. Normal not defterini açarak yazacağımız bazı kodları robots adıyla

kaydedip onu sitemizde root umuza yerleştirmemiz gerekir. Yapacağımız bu işlemle örümceği biz

yönetmiş oluyoruz. Ve hepinizinde tahmin edeceği gibi yönetmekten doğan bir güç ve bugün

karşılığı rastgele bilgilerle değilde tam anlamda istediğimiz bilgilerle arama motorlarında yer almak

güzeldir.

Şimdi robots.txt dosyası hakkında bilgi vererek işe başlayalım ;


Örümcek geldiği zaman o web sitesinin içeriğini indexlemek ister. Ancak güvenlik için genelde bir

çok hosting firmaları içerik indexlemeyi kapatmıştır. Sadece size özelde bunu açmazlar. Ama biz

robots.txt dosyamızla kendimize özel bir izin yaratabiliriz.


Basit olarak robots.txt dosyasının içinde şu iki satır olmak zorundadır..


User-agent:
Disallow:


Burada user-agent uygula disallo izin verme anlamındadır.

Bizede burda düşen görev bu iki komutu en etkili bir şekilde kullanmaktır.

mesela bir örnek verelim. Sitemizi indexlemeyi sadece google bot unun yapmasını istiyoruz. ve

sitemizdeki admin klaösrünü asla yayınlamamasını istiyoruz diyelim; ozaman bu iki komut şu

şekilde kullanılır;

User-agent: Googlebot
Disallow: /admin/

Gördüğünüz gibi uygulama alanı çok kolaydır. Ben burda size aktif hizmet veren arama

motorlarının isimlerini yazacam. Sizlerde hangilerinde yer almak isiyorsanız okadar

User-agentsatırı ekleyeceksiniz. Disallow kullanımı ise tamamen tercih meselasi olup kaç tane

klasör yada dosya yı gizlemek isterseniz okadar çok satır kullanmanız gerekir..

Şimdi google başta olmak üzere aktif bot mantığı ile çalışan bazı arama motorları ve portallar

şunlardır;




Googlebot
BizBot04 kirk.overleaf.com
HappyBot (gserver.kw.net)
CaliforniaBrownSpider
EI*Net/0.1 libwww/0.1
Ibot/1.0 libwww-perl/0.40
Merritt/1.0
StatFetcher/1.0
TeacherSoft/1.0 libwww/2.17
WWW Collector
processor/0.0ALPHA libwww-perl/0.20
wobot/1.0 from 206.214.202.45
Libertech-Rover www.libertech.com?
WhoWhere Robot
ITI Spider
w3index
MyCNNSpider
SummyCrawler
OGspider
linklooker
CyberSpyder (amant@www.cyberspyder.com)
SlowBot
heraSpider
Surfbot
Bizbot003
WebWalker
SandBot
EnigmaBot
spyder3.microsys.com
www.freeloader.com.


Burdaki tüm robotların başına User-agent ekleyip o robota izin verebiliriz..



Ayrıca disallow ile sitemizden izinsiz email adresleri çalan email robotlarınada çözüm bulup spam

maillerin önüne geçebiliriz bir nebze olsada ..

Ancak bu başlı başına bir konu olduğu için bunu ayrı bir yazı dizisi olarak ilk fırsatta burada

yayınlayacağım..


Önemli Not : Robotlar her nekadar prensip olarak robots.txt ye bağlı kalmaları gerekse bile arada

istisnalar olabilmektedir.



Bu yazıyı dilediğiniz gibi kendi sitenizde yayınlayıp sitenize giren diğer webmasterleride

bilgilendirmekte serbestsiniz.



Sevginin ve Bilginin Tükenmediği Bir dünya için

Hoşcakalın ..

KapTan




------------



@cezve arkadaşımızın izniyle eklemeler yapıyorum. bilgi için teşekkürler cezve ..





evet olaya seneler sonra donuyorum...

Devingen url leri arama motorlarina uygun hala getirmek...

gereklilikler:
-Web alani aldigimiz firmanin apache kullaniyor olmasi(hos kullanmiyan var mi! ama biz ms e killigimizi yapalim)
-web alani saglayicimiz .htaccess olayina izin verimesi (hos vermeyen yok ama ucretsiz alan saglayan bazi firmalarda da olayi gerceklestirmek isteyen arkadslarimiz hayal kirikligi yasamasin)

hazirlanisi:
1- kök dizine(root) inilir. ".htaccess"(evet noktasi var) dosyasi mevcut mu? bakilir. mevcut degil ise olusturulur...

2-".htaccess" dosyasi acilir ve icerisine(en altina)

RewriteEngine on
RewriteRule ...regular expression... [L]


satirlari girilir..

olay bundan ibaret. "regular expressin" ifademize gore apache gelen url leri yonlendirir...

regular expressin icin ufak ornekler vereyim;

ornegin bizim

http://www.sitecan.com/index.php?site=dh&id=3344

gibi bir url miz var bunu

http://www.sitecan.com/dh/3344.html

seklinde cagirilmasina olanak saglamak istiyoruz. o durumda satirimiz su sekilde olacak:

RewriteRule ^([a-z]+)/([0-9]+)\.html /index.php?site=$1&id=$2 [L]


iste bu olayi gerceklestirdikten sonra dinamik sayfalarimizin arama motorlarinca indexlenmemesine bahane kalmamis olur.... tek avantaji bu degildir. konumuza bagli olarak soyledik. artik yaraticiliginiza kalmis...

test edilmistir...

anlasilmayan noktalar olur ise ki olur normaldir; sorulmasi halinde daha acik sekilde ele aliriz...





< Bu mesaj bu kişi tarafından değiştirildi mhakanki -- 14 Kasım 2004, 17:04:49 >

U
20 yıl
Er

Gerçekten harika bir çalışma kaptan..

Tam zamanı ve yeri...


Bu mesaja 2 cevap geldi.
L
20 yıl
Yüzbaşı

Konuyla ilgili bulduğum bazı kaynaklar:

http://www.searchengineworld.com/index.htm
http://searchenginewatch.com/

Tabi kimse akıllılık (!) edip "Bir örümcek nasıl yazılır?" şeklinde bir yazı yayınlamamış görünüyor. Çünkü bunu yapabilen biri zaten Google'da filan çalışıyodur :) . Bu konuda C/C++ yardımı lazım olursa sorulara açığım. Ama örümcek yazma konusunda tecrübeli falan değilim ;)


Bu mesaja 1 cevap geldi.
M
20 yıl
Yarbay
Konu Sahibi

hımmm inceleyecem. ingilizce olduğu için biraz karışık ama türkçeye çevirip burda yayınlarım eğer işe yarar şeyler varsa..

Bilgi için saol ..


Bu mesaja 1 cevap geldi.
A
20 yıl
Yüzbaşı

TRGKaptan eline sağlık yalnız
<meta http-equiv="content-type" content="text/html; charset=ISO-8859-1"> da charset kısmı "ISO-8859-1" değil "ISO-8859-9" olacak sanırım yanlışlıkla yazdın.
Ayrıca Windows dışındaki işletim sistemlerine de türkçe karakterleri tanıtmak için
<meta http-equiv="Content-Type" content="text/html; charset=windows-1254"> tagını da eklersek iyi olur.


Bu mesaja 1 cevap geldi.
K
20 yıl
Yüzbaşı

Burda yazılanlar çok doğru da Google için maalesef artık yeterli değil

Özellikle rekabetin çok yoğun olduğu kelimelerde link bulmanız lazım. Bunun için mailinize gelen link exchange linklerini hemen silmeyin. Sayfanıza ana sayfadan ulaşılan bir linkler sayfası ve link ekleme formu koyun. Sizin için en önemli kelimeyi google'da arattığınızda ilk sıralarda gelen sitelerin 'benzer sayfalar' linkine tıklayın ve hangi siteler çıkıyorsa onlara kendi sitenizin linklerini eklemenin yollarını arayın.


Bu mesaja 1 cevap geldi.
E
20 yıl
Yüzbaşı

hakikaten mükemmel bir çalışma ellerine kollarına beynine sağlık.....


Bu mesaja 1 cevap geldi.
K
20 yıl
Yüzbaşı

Gerçekten çok yararlı ve önemli bir çalışma tebrikler ve teşekkürler....


Bu mesaja 1 cevap geldi.
G
20 yıl
Yarbay

Robotlar için eğer çok hızlı revisit istiyorsanız gün cinsinden kullanabilirsiniz;

<meta name="revisit-after" content="20 Days">

nokia game sırasında nokiagamer.com için 2 yada 3 gün revisit süresi kullanıyoruz. yılın diğer vakitlerinde 20 gün.


Bu mesaja 1 cevap geldi.
A
20 yıl
Binbaşı

metetag olayını anladık
peki sitemizi google nasıl bulur.yani bizim adresimiz webde hic bir yerde yokki google bize bir link bulsun. ???

www.edebiyatci.tk

mesela google'un bizi bulması için tek yol bu forumu okuyup yukarıdaki linki takip etmesimidir?


Bu mesaja 1 cevap geldi.
M
20 yıl
Yarbay
Konu Sahibi

yukarıda anlattığım gibi büyük arama motorlarının örümcekleri vardır ve günde milyonlarca siteyi gezerler. senin meta tagın olmasada robots dosyan olmasada zaten google seni listeye kesin ekler. ama arama yapıldığında artık bininci sitemi olursun iki binincimi bilmem. Bu meta taglar ve robotlar ise sitenin ön planda çıkmasını ve hangi keleimelerle arandığında bulunman gerektiğini kontrol etmemizi sağlıyor ..



Bu mesaja 1 cevap geldi.
G
20 yıl
Yarbay

Google'ın sizi bulmasını beklemek istemiyorsanız:

http://www.google.com/addurl.html

Yine de kayıtlara girmeniz için bir süre gerekiyor.


Bu mesaja 1 cevap geldi.
D
20 yıl
Yüzbaşı

google'in kendi sitesinden alinti: http://www.google.com/webmasters/faq.html (4. ve 6. sorularin cevaplari)

eger sitenize baska sitelerden link yoksa google'in sizi bulmasi ve indexlemesi icin bu url'yi kullanmaniz gerekmektedir. Tabii bu islem bi kac hafta alabilir.

http://http://www.google.com/addurl.html


Bu mesaja 1 cevap geldi.
M
20 yıl
Yarbay
Konu Sahibi

hatta daha da uzun bir zaman alabilir. genelde aylar sürer bu iş. ama ben yukarıda anlattığım robots dosyası ve meta tagl ile 3 haftada googlede 1. sayfada 9. firma olarak çıkmaya başladım ..



Bu mesaja 1 cevap geldi.
I
20 yıl
Yüzbaşı

Google'ye girip sitemizi kaydetmeyip de, Meta tag kodunu sayfaya yapıştırmakta yeterli.


Bu mesaja 1 cevap geldi.
M
20 yıl
Yarbay
Konu Sahibi

evet yeterli oluyor ama süreci hızlandırmak için eklemektede yarar var. bunun dışında google çok ziyaretçisi olan sitelerde linki bulunan siteleride daha çabuk arşive alıyor. bunun ilgili zaten bir projemiz var. aktif lendiği zaman haber veririm..




F
20 yıl
Çavuş

Bu yazının devamını beklemedeyim haberin olsun KAPTAN :).


Bu mesaja 1 cevap geldi.
N
20 yıl
Yüzbaşı

kaptan coştun yine...

ellerine sağlık. bekliyoruz devamını..


Bu mesaja 1 cevap geldi.
M
20 yıl
Yarbay
Konu Sahibi

merhaba arkadaşlar. bir süredir şehir dışındaydım. yeni geldim. evet ilk fırsatta gerek bu konu gerekse yeni konularla birlikte yazı dizisi 2-3-4-5 vb.. devem edecek..

İlgilenen herkese asıl ben teşekkür ederim.

Yararlı olabildiysem ne mutlu bana ..

Görüşmek Üzere..



G
20 yıl
Yüzbaşı

Bahsettiğiniz işlemleri yaptım ancak sitenin altında;

User-agent: Googlebot Disallow: /admin/ User-agent: BizBot04 kirk.overleaf.com User-agent: HappyBot (gserver.kw.net) User-agent: CaliforniaBrownSpider

yazısı görünüyor. Bu normal mi, görünmemesi için ne yapmak lazım ?


Bu mesaja 1 cevap geldi.