1. Hiện tại có một số member mạo danh BQT để giao dịch trên diễn đàn và đã LỪA ĐẢO khá nhiều tại chuyên mục Adwords... Mọi người cảnh giác và đọc bài: Giới thiệu giao dịch đảm bảo bởi @Admin

Tự động hóa báo cáo kỹ thuật với SEO

Thảo luận trong 'Các thủ thuật Seo khác' bắt đầu bởi thegioitỷ lệ cược bet365_trò chơi điện tử bet 365_ở việt nam có thể chơi bet365 không?, 26/11/16.

Lượt xem: 14,293
  1. thegioiseo

    thegioitỷ lệ cược bet365_trò chơi điện tử bet 365_ở việt nam có thể chơi bet365 không? Điều Hành Viên

    Gia nhập:
    22/5/11
    Bài viết:
    1,206
    Đã được thích:
    2,687
    (Thegioitỷ lệ cược bet365_trò chơi điện tử bet 365_ở việt nam có thể chơi bet365 không?) - Khi mà Web ngày càng trở nên phức tạp hơn, với framework JavaScript và thư viện front ends trên website, các ứng dụng web tiên tiến, ứng dụng single-page, JSON-LD chúng ta đang nhìn thấy ngày càng nhiều những sai lầm. Khi bạn có HTML, CSS và các liên kết, có rất nhiều thứ bạn cần phải làm. Tuy nhiên, ngày nay các trang web được tạo ra động với giao điện JS phổ biến, có rất nhiều lỗi tiềm ẩn bên trong đó.

    slide

    Vấn đề thứ hai chúng ta phải đối mặt khá nhiều đó là rất khó để biết cái gì đó đang đi sai hướng hoặc khi Google thay đổi cách thức chúng ta đang xử lý một cái gì đó. Làm thế nào chúng ta có thể giải quyết những thách thức này?

    Cách cũ

    Trong lịch sử, cách bạn muốn phân tích những thứ này là nhìn vào tập tin log của bạn và sử dụng Excel hoặc nếu bạn đang hardcore bạn có thể sử dụng Log Parser. Điều đó là tuyệt vời nhưng chúng yêu cầu bạn phải hiểu rõ hoặc bạn đang tìm kiếm để lấy một phần của bản ghi có vấn đề mà bạn cần phải giải quyết. Không gì là không thể và chúng tôi đã viết về việc này khá nhiều trên blog và đã có những hướng dẫn cho việc phân tích file log.

    Mặc dù vấn đề này là khá rõ ràng. Nó đòi hỏi bạn phải nhìn chứ không phải là bạn nghĩ cần phải tìm cái gì đó. Với ý nghĩ đó, tôi nghĩ rằng tôi muốn dành thời gian điều tra xem liệu có điều gì đó có thể làm toàn bộ quá trình này mà chỉ mất một chút thời gian và hành động như là một hệ thống cảnh báo sớm.

    Giải pháp

    Đầu tiên chúng ta cần phải làm là thiết lập máy chủ để gửi tập tin log ở đâu đó. Giải pháp mà tôi sử dụng đó là log rotation. Tùy thuộc vào máy chủ của bạn, bạn sẽ sử dụng các phương pháp khác nhau để đạt được điều này, nhưng trên Nginx nó trông như thế này:

    Mã:
    # time_iso8601 looks like this: 2016-08-10T14:53:00+01:00
    if ($time_iso8601 ~ "^(\d{4})-(\d{2})-(\d{2})") {
            set $year $1;
            set $month $2;
            set $day $3;
    }
    
    access_log /var/log/nginx/$year-$month-$day-access.log;
    Điều này cho phép bạn xem các bản ghi với một ngày cụ thể bằng cách đơn giản là kéo dữ liệu từ các tập tin liên quan đến ngày đó. Khi có thiết lập log rotation, chúng tôi có thể thiết lập một kịch bản để chạy lúc nửa đêm bằng cách sử dụng Cron để kéo tập tin log có liên quan đến dữ liệu ngày hôm qua và phân tích nó. Nếu bạn muốn, bạn có thể nhìn vài lần trong ngày hôm đó hoặc mỗi tuần một lần hoặc bất cứ khoảng thời gian nào phù hợp nhất với khối lượng dữ liệu của bạn.

    Câu hỏi tiếp theo là: Chúng tôi muốn tìm kiếm gì? Vâng, khi chúng ta đã có log cho ngày hôm đó, đây là điều mà hệ thống báo cáo của tôi trả về:

    Mã trạng thái 30*

    Tạo một danh sách tất cả các trang dẫn người dùng đến một chuyển hướng. Nếu trang liên kết đến trang web của bạn, hãy chuyển hướng nó đến điểm cuối. Nếu không hãy liên hệ với bất cứ ai liên kết đến bạn và phân loại các liên kết cần đi.

    Mã trạng thái 404

    Tương tự. Nguồn tài nguyên 404 cần phải được kiểm tra để chắc chắn rằng chúng đang bị thiếu. Bất cứ điều gì cũng cần phải điều tra lý do tại sao nó không được giải quyết.

    Mã trạng thái 50*

    Một điều xấu đã xảy ra và bạn sẽ không có một ngày tốt nếu bạn đang nhìn thấy nhiều mã 50*. Máy chủ của bạn đang hấp hối hoặc có thể toàn bộ trang web của bạn đang gặp nguy hiểm.

    Ngân sách thu thập

    Một danh sách chứa tất cả các nguồn tài nguyên mà Google đã thu thập, số lần nó được yêu cầu, bao nhiêu byte được chuyển giao và thời gian thực hiện để giải quyết những yêu cầu. So sánh nó với site map của bạn để tìm các trang mà Google sẽ không thu thập và khắc phục nó khi cần thiết.

    Các nguồn tài nguyên được yêu cầu

    Tương tự như trên nhưng nó chi tiết hơn và nó được yêu từ công cụ tìm kiếm.

    Các tác nhân xấu

    Nhiều bots đang tìm kiếm các lỗ hổng sẽ gửi yêu cầu tới những thứ như wp_admin, wp_login, 404s, config.php và các nguồn tài nguyên phổ biến khác. Bất kỳ địa chỉ IP nào mà được lặp đi lặp lại những yêu cầu sẽ được tự động thêm vào một danh sách đen IP.

    Mẫu báo cáo URL phù hợp

    Nó là đơn giản để sử dụng regex phù hợp với URL được yêu cầu với mô hình được xác định trước đó, báo cáo về các lĩnh vực cụ thể của trang web hoặc các trang. Ví dụ, bạn có thể báo cáo về yêu cầu hình ảnh, tập tin JavaScript được gọi, phân trang, submit form (thông qua tìm kiếm các yêu cầu POST), các tham số truy vấn hoặc bất kỳ điều gì nếu bạn muốn. Hãy cung cấp cho nó một URL hoặc yêu cầu HTTP, bạn có thể thiết lập nó như một phân khúc được báo cáo.

    Hành vi tìm kiếm khó hiểu

    Số lượng log yêu cầu được thực hiện bởi Googlebot mỗi ngày. Nếu nó tăng nhiều hơn x%, đây là lúc bạn cần phải quan tâm. Lưu ý, với hầu hết các dãy số, việc tính toán để phát hiện giá trị ngoại lệ là không khó, nó chỉ hơi tốn một chút thời gian của bạn.

    Dữ liệu đầu ra

    Tùy thuộc vào các phần cụ thể, bạn có thể thiết lập các dữ liệu theo một vài cách. Thứ nhất, số lượng mã trạng thái 40* và 50* là lớn hoặc các tác nhân yêu cầu là xấu thì đây là lúc bạn cần phải quan tâm. Điều này có thể cho bạn biết nếu có điều gì đó xảy ra và nó có khả năng chỉ ra một vấn đề lớn. Sau đó bạn có thể nhận được đầu vào và giải quyết nó như là một vấn đề cần được ưu tiên.

    Toàn bộ dữ liệu cũng có thể được thiết lập để được báo cáo thông qua một bảng điều khiển. Nếu bạn không có nhiều dữ liệu trong log của bạn, có thể bạn chỉ muốn truy vấn các tập tin và tạo ra báo cáo mới mỗi khi bạn xem nó. Mặt khác, các trang web với nhiều lưu lượng truy cập và các file log lớn hơn, bạn có thể muốn cache dữ liệu vào một tập tin riêng biệt, vì vậy dữ liệu không cần phải tính toán. Tuy nhiên phương pháp bạn sử dụng sẽ phải phụ thuộc rất nhiều vào quy mô bạn đang có và phần cứng máy chủ của bạn.

    Kết luận

    Nhờ vào log máy chủ, bạn sẽ biết được những rủi ro tiềm ẩn trên trang web của bạn. Thông qua báo cáo các vấn đề kỹ thuật, bạn có thể biết được một thế giới mà Google thu thập thông tin với tốc độ nhanh hơn bao giờ hết, có nghĩa là họ có thể bắt đầu kéo thứ hạng của bạn xuống bởi thời gian chết của trang web hoặc lỗi trong vòng một vài giờ. Hãy thiết lập việc theo dõi và đảm bảo rằng bạn có thể tránh được các rủi ro tiềm ẩn với trang web của bạn.


    nganha2000nguyenhuutinh1992 thích bài này.
  2. Máy chiếu VNPC

    Máy chiếu VNPC Top 8

    Gia nhập:
    26/1/16
    Bài viết:
    289
    Đã được thích:
    27
    Nơi ở:
    73/4 Tân Sơn Nhì - Q.Tân Phú - TP.HCM
    Web:
    Cái này hơi nâng cao và nhiều bạn lười biếng thực hiện lắm. Nói chung kiểm tra file log vẫn thường được các webmaster sử dụng để dò lỗi trên website chứ còn bảo mật cho website bằng cái này thì chưa ổn tí nào.
  3. thuylanh94

    thuylanh94 Top 10

    Gia nhập:
    28/10/16
    Bài viết:
    28
    Đã được thích:
    2
    cái này khó quá. em chưa tìm hiểu đến phần này ad ạ. nhưng cảm ơn bài viết của ad nhé.
  4. nguyenhuutinh1992

    nguyenhuutinh1992 Top 7

    Gia nhập:
    26/9/13
    Bài viết:
    1,778
    Đã được thích:
    165
    Web:
    đúng thật, từ trước giờ toàn làm thủ công lâu lâu mới, nếu website chạy ổn có khi cả tháng mới chịu mò vào webmaster xem có lỗi không.
  5. dieuhoa1

    dieuhoa1 Top 9

    Gia nhập:
    12/9/15
    Bài viết:
    460
    Đã được thích:
    10
    cái này nghe mông nung quá mình chả hiểu gì cả
  6. lenam

    lenam Seo Newbie

    Gia nhập:
    13/11/16
    Bài viết:
    10
    Đã được thích:
    0
    Nói chung kiểm tra file log vẫn thường được các webmaster sử dụng để dò lỗi trên website chứ còn bảo mật cho website bằng cái này thì chưa ổn tí nào
  7. 17071997nnt

    17071997nnt Top 9

    Gia nhập:
    19/11/16
    Bài viết:
    62
    Đã được thích:
    7
    Tự động hóa kỹ thuật có phải là dùng tool không vậy thím -_-
  8. thuvtt1

    thuvtt1 Top 9

    Gia nhập:
    24/5/16
    Bài viết:
    41
    Đã được thích:
    7
    Web:
    Đây là dùng tool ạ? Nhưng độ lặp lại có cao k?
  9. Tien Viet

    Tien Viet Top 9

    Gia nhập:
    25/7/16
    Bài viết:
    134
    Đã được thích:
    12
    Web:
    có vụ này nữa hả bác? giờ em mới biết, cảm ơn chia sẻ của chủ thớt
  10. Game_Private

    Game_Private Top 9

    Gia nhập:
    27/7/16
    Bài viết:
    111
    Đã được thích:
    10
    Nơi ở:
    Hà Nội
    Web:
    Mình nghĩ nó cũng là 1 dạng tool đó
  11. huyhoang08

    huyhoang08 Top 8

    Gia nhập:
    24/9/11
    Bài viết:
    541
    Đã được thích:
    34
    Web:
    Không nên quá trú trọng vào các thủ thuật SEO tìm mọi cách để website lên TOP. Khái niệm đó bây giờ không còn nữa.
  12. ducseven

    ducseven Top 9

    Gia nhập:
    11/11/16
    Bài viết:
    51
    Đã được thích:
    0
    Web:
    Giờ thấy cả trên youtube còn có cả phần mềm quản lý các gmail và các kênh youtube nữa.
  13. olympia

    olympia Top 9

    Gia nhập:
    3/11/16
    Bài viết:
    55
    Đã được thích:
    4
    Nơi ở:
    Hồ Chí Minh
    Web:
    Cái này nhìn thì ok nhưng mình chưa làm lần nào hết. Không biết có ảnh hưởng tới SEO nhiều không vây thớ
  14. thienlyma90

    thienlyma90 Top 7

    Gia nhập:
    7/6/13
    Bài viết:
    1,329
    Đã được thích:
    86
    Nơi ở:
    HN
    Web:
    Cái này bạn chỉ cần tối ưu 1 lần và dùng mãi mãi mà bạn. :D Nếu còn lười nữa thì đúng là chịu thôi!
  15. banmuonhenho

    banmuonhenho Top 9

    Gia nhập:
    27/10/16
    Bài viết:
    104
    Đã được thích:
    10
    Web:
    Mọi người có thể tải class_mysql trên mạng hoặc có thể dùng hàm mysql_error() để kiểm tra lỗi và tạo ra file error.txt để tiện theo dõi.
  16. thangsondoan

    thangsondoan Seo Newbie

    Gia nhập:
    10/10/16
    Bài viết:
    10
    Đã được thích:
    0
    Bác có thể quay video hướng dẫn cho anh em cùng xem ko, em không chuyên về kỹ thuật nên đọc thế này thấy hơi mông lung @@
  17. opalu

    opalu Top 9

    Gia nhập:
    16/9/16
    Bài viết:
    63
    Đã được thích:
    8
    Nơi ở:
    Biên Hòa - Đồng Nai
    Web:
    Lé vờ thấp quá... nên hok có tìm hiểu đến mấy thằng này lun, mà đọc xong cũng hok hiu lun :) cảm ơn ad đã chia sẻ. Cố gắng trao dồi thêm
  18. benhxahoihcm

    benhxahoihcm Top 8

    Gia nhập:
    23/10/15
    Bài viết:
    316
    Đã được thích:
    35
    Nơi ở:
    thiet ke shop Viky Design
    Web:
    Đúng là đọc mông lung ghê. Không chuyên về cái này lắm. :D
  19. SeoNewss

    SeoNewss Top 9

    Gia nhập:
    24/8/16
    Bài viết:
    86
    Đã được thích:
    7
    Nơi ở:
    HCM
    Web:
    cách này làm khó quá
  20. smartvn33

    smartvn33 Top 10

    Gia nhập:
    1/12/16
    Bài viết:
    4
    Đã được thích:
    1
    Web:
    Để có báo các kết quả SEO là điều tốt nhưng trên thực tế không ai quan tâm đến nó mà hủ yếu quan tâm đến thứ hạng của từ khóa thôi.

Nội quy khi thảo luận:

Dù bạn có cố tình spam bằng cách nào khi BQT diễn đàn phát hiện sẽ lập tức banned nick và xoá toàn bộ bài viết của bạn. Ngoài ra khi phát hiện ra Spam hãy gửi thông báo cho BQT diễn đàn. Hãy suy nghĩ trước khi hành động..!
✓ Khi muốn trả lời ai đó, bạn gõ @ cộng thêm nick diễn đàn của người đó phía sau @, giống như tag tên trên Facebook.
✓ Yêu cầu khi bình luận, bạn phải gõ chữ rõ ràng, không viết tắt, gõ tiếng Việt đầy đủ dấu câu.
✓ Nên dùng font chữ mặc định của diễn đàn, không tô màu lòe loẹt hay dùng size chữ quá lớn khi bình luận.
✓ Bài viết, comment... không được phép quảng cáo dịch vụ, rao vặt, pr... Loại trừ ở chuyên mục Rao vặt đã cho phép.
✓ Nghiêm cấm các chủ đề dạng: Cứu em với, help me, giật tít, câu view... dưới mọi hình thức.
✓ Tất cả các thành viên tham gia diễn đàn cần đọc kỹ Nội quy chung và nghiêm túc tuân thủ.


Chia sẻ trang này

Đang tải...