Как пропустить строки при чтении файла CSV с помощью Pandas?
Python - хороший язык для анализа данных из-за удивительной экосистемы пакетов Python, ориентированных на данные. Пакет Pandas - один из них, который значительно упрощает импорт и анализ данных.
Here, we will discuss how to skip rows while reading csv file. We will use read_csv() method of Pandas library for this task.
Syntax: pd.read_csv(filepath_or_buffer, sep=’, ‘, delimiter=None, header=’infer’, names=None, index_col=None, usecols=None, squeeze=False, prefix=None, mangle_dupe_cols=True, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skipinitialspace=False, skiprows=None, nrows=None, na_values=None, keep_default_na=True, na_filter=True, verbose=False, skip_blank_lines=True, parse_dates=False, infer_datetime_format=False, keep_date_col=False, date_parser=None, dayfirst=False, iterator=False, chunksize=None, compression=’infer’, thousands=None, decimal=b’.’, lineterminator=None, quotechar="”‘, quoting=0, escapechar=None, comment=None, encoding=None, dialect=None, tupleize_cols=None, error_bad_lines=True, warn_bad_lines=True, skipfooter=0, doublequote=True, delim_whitespace=False, low_memory=True, memory_map=False, float_precision=None)
Некоторые полезные параметры приведены ниже:
| Параметр | Использовать |
|---|---|
| filepath_or_buffer | URL или Dir расположение файла |
| сен | Обозначает разделитель, по умолчанию - ',' как в csv (значения, разделенные запятыми) |
| index_col | Этот параметр используется, чтобы сделать переданный столбец индексом вместо 0, 1, 2, 3… r |
| заголовок | Этот параметр используется, чтобы сделать переданную строку / s [список int / int] в качестве заголовка. |
| use_cols | Этот параметр использует только переданный столбец [список строк] для создания фрейма данных. |
| сжимать | Если True и передан только один столбец, возвращает серию панд |
| скипроу | Этот параметр используется для пропуска переданных строк в новом фрейме данных. |
| skipfooter | Этот параметр используется для пропуска количества строк внизу файла. |
Чтобы загрузить файл student.csv, нажмите здесь
Method 1: Skipping N rows from the starting while reading a csv file.
Code:
# Importing Pandas libraryimport pandas as pd # Skiping 2 rows from start in csv# and initialize it to a dataframedf = pd.read_csv("students.csv", skiprows = 2) # Show the dataframedf |
Выход : 
Method 2: Skipping rows at specific positions while reading a csv file.
Code:
# Importing Pandas libraryimport pandas as pd # Skiping rows at specific positiondf = pd.read_csv("students.csv", skiprows = [0, 2, 5]) # Show the dataframedf |
Выход : 
Method 3: Skipping N rows from the starting except column names while reading a csv file.
Code:
# Importing Pandas libraryimport pandas as pd # Skiping 2 rows from start # except the coulmn namesdf = pd.read_csv("students.csv", skiprows = [i for i in range(1, 3) ]) # Show the dataframedf |
Выход : 
Method 4: Skip rows based on a condition while reading a csv file.
Code:
# Importing Pandas libraryimport pandas as pd # function for checking and # skipping every 3rd line def logic(index): if index % 3 == 0: return True return False # Skiping rows based on a conditiondf = pd.read_csv("students.csv", skiprows = lambda x: logic(x) ) # Show the dataframedf |
Выход : 
Method 5: Skip N rows from the end while reading a csv file.
Code:
# Importing Pandas libraryimport pandas as pd # Skiping 2 rows from enddf = pd.read_csv("students.csv", skipfooter = 5, engine = "python") # Show the dataframedf |
Выход : 
Внимание компьютерщик! Укрепите свои основы с помощью базового курса программирования Python и изучите основы.
Для начала подготовьтесь к собеседованию. Расширьте свои концепции структур данных с помощью курса Python DS. А чтобы начать свое путешествие по машинному обучению, присоединяйтесь к курсу Машинное обучение - базовый уровень.