ಪಾಂಡಾಗಳು 1.0 ನಮಗೆ ಏನು ತಂದಿತು

ಪಾಂಡಾಗಳು 1.0 ನಮಗೆ ಏನು ತಂದಿತು

ಜನವರಿ 9 ರಂದು, ಪಾಂಡಾಸ್ 1.0.0rc ಬಿಡುಗಡೆಯಾಯಿತು. ಲೈಬ್ರರಿಯ ಹಿಂದಿನ ಆವೃತ್ತಿಯು 0.25 ಆಗಿದೆ.

ಮೊದಲ ಪ್ರಮುಖ ಬಿಡುಗಡೆಯು ಸುಧಾರಿತ ಸ್ವಯಂಚಾಲಿತ ಡೇಟಾಫ್ರೇಮ್ ಸಾರಾಂಶ, ಹೆಚ್ಚಿನ ಔಟ್‌ಪುಟ್ ಸ್ವರೂಪಗಳು, ಹೊಸ ಡೇಟಾ ಪ್ರಕಾರಗಳು ಮತ್ತು ಹೊಸ ದಸ್ತಾವೇಜನ್ನು ಸೈಟ್ ಸೇರಿದಂತೆ ಅನೇಕ ಉತ್ತಮ ಹೊಸ ವೈಶಿಷ್ಟ್ಯಗಳನ್ನು ಒಳಗೊಂಡಿದೆ.

ಎಲ್ಲಾ ಬದಲಾವಣೆಗಳನ್ನು ವೀಕ್ಷಿಸಬಹುದು ಇಲ್ಲಿ, ಲೇಖನದಲ್ಲಿ ನಾವು ಪ್ರಮುಖ ವಿಷಯಗಳ ಸಣ್ಣ, ಕಡಿಮೆ ತಾಂತ್ರಿಕ ವಿಮರ್ಶೆಗೆ ನಮ್ಮನ್ನು ಮಿತಿಗೊಳಿಸುತ್ತೇವೆ.

ನೀವು ಎಂದಿನಂತೆ ಲೈಬ್ರರಿಯನ್ನು ಸ್ಥಾಪಿಸಬಹುದು ಪಿಪ್, ಆದರೆ ಪಾಂಡಾಸ್ 1.0 ಬರೆಯುವ ಸಮಯದಲ್ಲಿ ಇನ್ನೂ ಅಭ್ಯರ್ಥಿಯನ್ನು ಬಿಡುಗಡೆ ಮಾಡಿ, ನೀವು ಆವೃತ್ತಿಯನ್ನು ಸ್ಪಷ್ಟವಾಗಿ ನಿರ್ದಿಷ್ಟಪಡಿಸುವ ಅಗತ್ಯವಿದೆ:

pip install --upgrade pandas==1.0.0rc0

ಜಾಗರೂಕರಾಗಿರಿ: ಇದು ಪ್ರಮುಖ ಬಿಡುಗಡೆಯಾದ್ದರಿಂದ, ನವೀಕರಣವು ಹಳೆಯ ಕೋಡ್ ಅನ್ನು ಮುರಿಯಬಹುದು!

ಮೂಲಕ, ಈ ಆವೃತ್ತಿಯಿಂದ ಪೈಥಾನ್ 2 ಗೆ ಬೆಂಬಲವನ್ನು ಸಂಪೂರ್ಣವಾಗಿ ನಿಲ್ಲಿಸಲಾಗಿದೆ (ಒಳ್ಳೆಯ ಕಾರಣ ಏನು ಆಗಿರಬಹುದು ನವೀಕರಿಸಿ - ಅಂದಾಜು ಅನುವಾದ) ಪಾಂಡಾಸ್ 1.0 ಗೆ ಕನಿಷ್ಠ ಪೈಥಾನ್ 3.6+ ಅಗತ್ಯವಿದೆ, ಆದ್ದರಿಂದ ನಿಮಗೆ ಖಚಿತವಿಲ್ಲದಿದ್ದರೆ, ನೀವು ಯಾವುದನ್ನು ಸ್ಥಾಪಿಸಿದ್ದೀರಿ ಎಂಬುದನ್ನು ಪರಿಶೀಲಿಸಿ:

$ pip --version
pip 19.3.1 from /usr/local/lib/python3.7/site-packages/pip (python 3.7)

$ python --version
Python 3.7.5

ಪಾಂಡಾಗಳ ಆವೃತ್ತಿಯನ್ನು ಪರಿಶೀಲಿಸಲು ಸುಲಭವಾದ ಮಾರ್ಗವೆಂದರೆ:

>>> import pandas as pd
>>> pd.__version__
1.0.0rc0

DataFrame.info ನೊಂದಿಗೆ ಸುಧಾರಿತ ಸ್ವಯಂ ಸಾರಾಂಶ

ನನ್ನ ಮೆಚ್ಚಿನ ನಾವೀನ್ಯತೆ ವಿಧಾನಕ್ಕೆ ಅಪ್ಡೇಟ್ ಆಗಿತ್ತು DataFrame.info. ಕಾರ್ಯವು ಹೆಚ್ಚು ಓದಬಲ್ಲದು, ಡೇಟಾ ಪರಿಶೋಧನೆಯ ಪ್ರಕ್ರಿಯೆಯನ್ನು ಇನ್ನಷ್ಟು ಸುಲಭಗೊಳಿಸುತ್ತದೆ:

>>> df = pd.DataFrame({
...:   'A': [1,2,3], 
...:   'B': ["goodbye", "cruel", "world"], 
...:   'C': [False, True, False]
...:})
>>> df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
 #   Column  Non-Null Count  Dtype
---  ------  --------------  -----
 0   A       3 non-null      int64
 1   B       3 non-null      object
 2   C       3 non-null      object
dtypes: int64(1), object(2)
memory usage: 200.0+ bytes

ಮಾರ್ಕ್‌ಡೌನ್ ಸ್ವರೂಪದಲ್ಲಿ ಕೋಷ್ಟಕಗಳನ್ನು ಔಟ್‌ಪುಟ್ ಮಾಡುವುದು

ಮಾರ್ಕ್‌ಡೌನ್ ಕೋಷ್ಟಕಗಳನ್ನು ಬಳಸಿಕೊಂಡು ಡೇಟಾಫ್ರೇಮ್‌ಗಳನ್ನು ರಫ್ತು ಮಾಡುವ ಸಾಮರ್ಥ್ಯವು ಅಷ್ಟೇ ಆಹ್ಲಾದಕರವಾದ ನಾವೀನ್ಯತೆಯಾಗಿದೆ DataFrame.to_markdown.

>>> df.to_markdown()
|    |   A | B       | C     |
|---:|----:|:--------|:------|
|  0 |   1 | goodbye | False |
|  1 |   2 | cruel   | True  |
|  2 |   3 | world   | False |

ಗಿಥಬ್ ಜಿಸ್ಟ್‌ಗಳನ್ನು ಬಳಸಿಕೊಂಡು ಮೀಡಿಯಂನಂತಹ ಸೈಟ್‌ಗಳಲ್ಲಿ ಕೋಷ್ಟಕಗಳನ್ನು ಪ್ರಕಟಿಸಲು ಇದು ಹೆಚ್ಚು ಸುಲಭವಾಗುತ್ತದೆ.

ಪಾಂಡಾಗಳು 1.0 ನಮಗೆ ಏನು ತಂದಿತು

ತಂತಿಗಳು ಮತ್ತು ಬೂಲಿಯನ್‌ಗಳಿಗಾಗಿ ಹೊಸ ಪ್ರಕಾರಗಳು

ಪಾಂಡಾಸ್ 1.0 ಬಿಡುಗಡೆಯು ಹೊಸದನ್ನು ಸೇರಿಸಿದೆ ಪ್ರಾಯೋಗಿಕ ರೀತಿಯ. ಅವರ API ಇನ್ನೂ ಬದಲಾಗಬಹುದು, ಆದ್ದರಿಂದ ಅದನ್ನು ಎಚ್ಚರಿಕೆಯಿಂದ ಬಳಸಿ. ಆದರೆ ಸಾಮಾನ್ಯವಾಗಿ, ಪಾಂಡಾಗಳು ಅರ್ಥವಿರುವಲ್ಲೆಲ್ಲಾ ಹೊಸ ಪ್ರಕಾರಗಳನ್ನು ಬಳಸಲು ಶಿಫಾರಸು ಮಾಡುತ್ತಾರೆ.

ಸದ್ಯಕ್ಕೆ, ಪಾತ್ರವರ್ಗವನ್ನು ಸ್ಪಷ್ಟವಾಗಿ ಮಾಡಬೇಕಾಗಿದೆ:

>>> B = pd.Series(["goodbye", "cruel", "world"], dtype="string")
>>> C = pd.Series([False, True, False], dtype="bool")
>>> df.B = B, df.C = C
>>> df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
 #   Column  Non-Null Count  Dtype
---  ------  --------------  -----
 0   A       3 non-null      int64
 1   B       3 non-null      string
 2   C       3 non-null      bool
dtypes: int64(1), object(1), string(1)
memory usage: 200.0+ bytes

ಕಾಲಮ್ ಹೇಗೆ ಎಂಬುದನ್ನು ಗಮನಿಸಿ ಡಿಟೈಪ್ ಮಾಡಿ ಹೊಸ ಪ್ರಕಾರಗಳನ್ನು ಪ್ರದರ್ಶಿಸುತ್ತದೆ - ಸ್ಟ್ರಿಂಗ್ и bool.

ಹೊಸ ಸ್ಟ್ರಿಂಗ್ ಪ್ರಕಾರದ ಅತ್ಯಂತ ಉಪಯುಕ್ತ ವೈಶಿಷ್ಟ್ಯವೆಂದರೆ ಆಯ್ಕೆ ಮಾಡುವ ಸಾಮರ್ಥ್ಯ ಸಾಲು ಕಾಲಮ್‌ಗಳು ಮಾತ್ರ ಡೇಟಾಫ್ರೇಮ್‌ಗಳಿಂದ. ಇದು ಪಠ್ಯ ಡೇಟಾವನ್ನು ಪಾರ್ಸಿಂಗ್ ಮಾಡುವುದನ್ನು ಹೆಚ್ಚು ಸುಲಭಗೊಳಿಸುತ್ತದೆ:

df.select_dtypes("string")

ಹಿಂದೆ, ಹೆಸರುಗಳನ್ನು ಸ್ಪಷ್ಟವಾಗಿ ಸೂಚಿಸದೆ ಸಾಲು ಕಾಲಮ್‌ಗಳನ್ನು ಆಯ್ಕೆ ಮಾಡಲಾಗುತ್ತಿರಲಿಲ್ಲ.

ಹೊಸ ಪ್ರಕಾರಗಳ ಬಗ್ಗೆ ನೀವು ಇನ್ನಷ್ಟು ಓದಬಹುದು ಇಲ್ಲಿ.

ಓದಿದ್ದಕ್ಕೆ ಧನ್ಯವಾದಗಳು! ಈಗಾಗಲೇ ಹೇಳಿದಂತೆ ಬದಲಾವಣೆಗಳ ಸಂಪೂರ್ಣ ಪಟ್ಟಿಯನ್ನು ವೀಕ್ಷಿಸಬಹುದು ಇಲ್ಲಿ.

ಮೂಲ: www.habr.com

ಕಾಮೆಂಟ್ ಅನ್ನು ಸೇರಿಸಿ