Định nghĩa Cross-Validation là gì?

Cross-ValidationCross-Validation. Đây là nghĩa tiếng Việt của thuật ngữ Cross-Validation – một thuật ngữ thuộc nhóm Technology Terms – Công nghệ thông tin.

Độ phổ biến(Factor rating): 5/10

Cross-validation là một kỹ thuật được sử dụng để đánh giá như thế nào về kết quả phân tích thống kê generalize đến một tập hợp dữ liệu độc lập. Cross-validation phần lớn được sử dụng trong các môi trường mà mục tiêu là dự đoán và nó là cần thiết để ước tính chính xác của việc thực hiện một mô hình tiên đoán. Lý do chính cho việc sử dụng cross-validation chứ không phải xác nhận thông thường là không có đủ dữ liệu có sẵn để phân vùng chúng vào đào tạo và thử nghiệm bộ riêng biệt (như trong xác nhận thông thường). Đây kết quả trong một sự mất mát của thử nghiệm và mô hình hóa khả năng.

Xem thêm: Thuật ngữ công nghệ A-Z

Giải thích ý nghĩa

Đối với một vấn đề dự đoán, một mô hình thường được cung cấp với một bộ dữ liệu của dữ liệu được biết đến, được gọi là đào tạo tập hợp dữ liệu, và một tập hợp các dữ liệu chưa biết dựa vào đó mô hình được kiểm tra, được gọi là tập dữ liệu thử nghiệm. Mục tiêu là phải có một tập hợp dữ liệu để thử nghiệm mô hình trong giai đoạn đào tạo và sau đó cung cấp cái nhìn sâu sắc về cách thích nghi mô hình cụ thể để một bộ dữ liệu độc lập. Một vòng qua xác nhận bao gồm các phân vùng dữ liệu thành các tập con bổ sung, sau đó tiến hành phân tích trên một tập hợp con. Sau đó, việc phân tích được xác nhận trên các tập con khác (bộ thử nghiệm). Để giảm biến đổi, nhiều vòng qua xác nhận được thực hiện sử dụng nhiều phân vùng khác nhau và sau đó trung bình các kết quả được thực hiện. Cross-validation là một kỹ thuật mạnh mẽ trong việc ước lượng kỹ thuật thực hiện mô hình.

What is the Cross-Validation? – Definition

Cross-validation is a technique that is used for the assessment of how the results of statistical analysis generalize to an independent data set. Cross-validation is largely used in settings where the target is prediction and it is necessary to estimate the accuracy of the performance of a predictive model. The prime reason for the use of cross-validation rather than conventional validation is that there is not enough data available for partitioning them into separate training and test sets (as in conventional validation). This results in a loss of testing and modeling capability.

Understanding the Cross-Validation

For a prediction problem, a model is generally provided with a data set of known data, called the training data set, and a set of unknown data against which the model is tested, known as the test data set. The target is to have a data set for testing the model in the training phase and then provide insight on how the specific model adapts to an independent data set. A round of cross-validation comprises the partitioning of data into complementary subsets, then performing analysis on one subset. After this, the analysis is validated on other subsets (testing sets). To reduce variability, many rounds of cross-validation are performed using many different partitions and then an average of the results are taken. Cross-validation is a powerful technique in the estimation of model performance technique.

Thuật ngữ liên quan

  • Data
  • Statistical Mean
  • Predictive Analytics
  • Data Analytics
  • Overfitting
  • Backsourcing
  • Cloud Provider
  • Data Mart
  • Retrosourcing
  • Cloud Portability

Source: Cross-Validation là gì? Technology Dictionary – biabop – Techtopedia – Techterm

Rate this post