ಜನವರಿ 9 ರಂದು, ಪಾಂಡಾಸ್ 1.0.0rc ಬಿಡುಗಡೆಯಾಯಿತು. ಲೈಬ್ರರಿಯ ಹಿಂದಿನ ಆವೃತ್ತಿಯು 0.25 ಆಗಿದೆ.
ಮೊದಲ ಪ್ರಮುಖ ಬಿಡುಗಡೆಯು ಸುಧಾರಿತ ಸ್ವಯಂಚಾಲಿತ ಡೇಟಾಫ್ರೇಮ್ ಸಾರಾಂಶ, ಹೆಚ್ಚಿನ ಔಟ್ಪುಟ್ ಸ್ವರೂಪಗಳು, ಹೊಸ ಡೇಟಾ ಪ್ರಕಾರಗಳು ಮತ್ತು ಹೊಸ ದಸ್ತಾವೇಜನ್ನು ಸೈಟ್ ಸೇರಿದಂತೆ ಅನೇಕ ಉತ್ತಮ ಹೊಸ ವೈಶಿಷ್ಟ್ಯಗಳನ್ನು ಒಳಗೊಂಡಿದೆ.
ಎಲ್ಲಾ ಬದಲಾವಣೆಗಳನ್ನು ವೀಕ್ಷಿಸಬಹುದು
ನೀವು ಎಂದಿನಂತೆ ಲೈಬ್ರರಿಯನ್ನು ಸ್ಥಾಪಿಸಬಹುದು ಪಿಪ್, ಆದರೆ ಪಾಂಡಾಸ್ 1.0 ಬರೆಯುವ ಸಮಯದಲ್ಲಿ ಇನ್ನೂ ಅಭ್ಯರ್ಥಿಯನ್ನು ಬಿಡುಗಡೆ ಮಾಡಿ, ನೀವು ಆವೃತ್ತಿಯನ್ನು ಸ್ಪಷ್ಟವಾಗಿ ನಿರ್ದಿಷ್ಟಪಡಿಸುವ ಅಗತ್ಯವಿದೆ:
pip install --upgrade pandas==1.0.0rc0
ಜಾಗರೂಕರಾಗಿರಿ: ಇದು ಪ್ರಮುಖ ಬಿಡುಗಡೆಯಾದ್ದರಿಂದ, ನವೀಕರಣವು ಹಳೆಯ ಕೋಡ್ ಅನ್ನು ಮುರಿಯಬಹುದು!
ಮೂಲಕ, ಈ ಆವೃತ್ತಿಯಿಂದ ಪೈಥಾನ್ 2 ಗೆ ಬೆಂಬಲವನ್ನು ಸಂಪೂರ್ಣವಾಗಿ ನಿಲ್ಲಿಸಲಾಗಿದೆ (ಒಳ್ಳೆಯ ಕಾರಣ ಏನು ಆಗಿರಬಹುದು
$ pip --version
pip 19.3.1 from /usr/local/lib/python3.7/site-packages/pip (python 3.7)
$ python --version
Python 3.7.5
ಪಾಂಡಾಗಳ ಆವೃತ್ತಿಯನ್ನು ಪರಿಶೀಲಿಸಲು ಸುಲಭವಾದ ಮಾರ್ಗವೆಂದರೆ:
>>> import pandas as pd
>>> pd.__version__
1.0.0rc0
DataFrame.info ನೊಂದಿಗೆ ಸುಧಾರಿತ ಸ್ವಯಂ ಸಾರಾಂಶ
ನನ್ನ ಮೆಚ್ಚಿನ ನಾವೀನ್ಯತೆ ವಿಧಾನಕ್ಕೆ ಅಪ್ಡೇಟ್ ಆಗಿತ್ತು DataFrame.info. ಕಾರ್ಯವು ಹೆಚ್ಚು ಓದಬಲ್ಲದು, ಡೇಟಾ ಪರಿಶೋಧನೆಯ ಪ್ರಕ್ರಿಯೆಯನ್ನು ಇನ್ನಷ್ಟು ಸುಲಭಗೊಳಿಸುತ್ತದೆ:
>>> df = pd.DataFrame({
...: 'A': [1,2,3],
...: 'B': ["goodbye", "cruel", "world"],
...: 'C': [False, True, False]
...:})
>>> df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 A 3 non-null int64
1 B 3 non-null object
2 C 3 non-null object
dtypes: int64(1), object(2)
memory usage: 200.0+ bytes
ಮಾರ್ಕ್ಡೌನ್ ಸ್ವರೂಪದಲ್ಲಿ ಕೋಷ್ಟಕಗಳನ್ನು ಔಟ್ಪುಟ್ ಮಾಡುವುದು
ಮಾರ್ಕ್ಡೌನ್ ಕೋಷ್ಟಕಗಳನ್ನು ಬಳಸಿಕೊಂಡು ಡೇಟಾಫ್ರೇಮ್ಗಳನ್ನು ರಫ್ತು ಮಾಡುವ ಸಾಮರ್ಥ್ಯವು ಅಷ್ಟೇ ಆಹ್ಲಾದಕರವಾದ ನಾವೀನ್ಯತೆಯಾಗಿದೆ DataFrame.to_markdown.
>>> df.to_markdown()
| | A | B | C |
|---:|----:|:--------|:------|
| 0 | 1 | goodbye | False |
| 1 | 2 | cruel | True |
| 2 | 3 | world | False |
ಗಿಥಬ್ ಜಿಸ್ಟ್ಗಳನ್ನು ಬಳಸಿಕೊಂಡು ಮೀಡಿಯಂನಂತಹ ಸೈಟ್ಗಳಲ್ಲಿ ಕೋಷ್ಟಕಗಳನ್ನು ಪ್ರಕಟಿಸಲು ಇದು ಹೆಚ್ಚು ಸುಲಭವಾಗುತ್ತದೆ.
ತಂತಿಗಳು ಮತ್ತು ಬೂಲಿಯನ್ಗಳಿಗಾಗಿ ಹೊಸ ಪ್ರಕಾರಗಳು
ಪಾಂಡಾಸ್ 1.0 ಬಿಡುಗಡೆಯು ಹೊಸದನ್ನು ಸೇರಿಸಿದೆ ಪ್ರಾಯೋಗಿಕ ರೀತಿಯ. ಅವರ API ಇನ್ನೂ ಬದಲಾಗಬಹುದು, ಆದ್ದರಿಂದ ಅದನ್ನು ಎಚ್ಚರಿಕೆಯಿಂದ ಬಳಸಿ. ಆದರೆ ಸಾಮಾನ್ಯವಾಗಿ, ಪಾಂಡಾಗಳು ಅರ್ಥವಿರುವಲ್ಲೆಲ್ಲಾ ಹೊಸ ಪ್ರಕಾರಗಳನ್ನು ಬಳಸಲು ಶಿಫಾರಸು ಮಾಡುತ್ತಾರೆ.
ಸದ್ಯಕ್ಕೆ, ಪಾತ್ರವರ್ಗವನ್ನು ಸ್ಪಷ್ಟವಾಗಿ ಮಾಡಬೇಕಾಗಿದೆ:
>>> B = pd.Series(["goodbye", "cruel", "world"], dtype="string")
>>> C = pd.Series([False, True, False], dtype="bool")
>>> df.B = B, df.C = C
>>> df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 3 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 A 3 non-null int64
1 B 3 non-null string
2 C 3 non-null bool
dtypes: int64(1), object(1), string(1)
memory usage: 200.0+ bytes
ಕಾಲಮ್ ಹೇಗೆ ಎಂಬುದನ್ನು ಗಮನಿಸಿ ಡಿಟೈಪ್ ಮಾಡಿ ಹೊಸ ಪ್ರಕಾರಗಳನ್ನು ಪ್ರದರ್ಶಿಸುತ್ತದೆ - ಸ್ಟ್ರಿಂಗ್ и bool.
ಹೊಸ ಸ್ಟ್ರಿಂಗ್ ಪ್ರಕಾರದ ಅತ್ಯಂತ ಉಪಯುಕ್ತ ವೈಶಿಷ್ಟ್ಯವೆಂದರೆ ಆಯ್ಕೆ ಮಾಡುವ ಸಾಮರ್ಥ್ಯ ಸಾಲು ಕಾಲಮ್ಗಳು ಮಾತ್ರ ಡೇಟಾಫ್ರೇಮ್ಗಳಿಂದ. ಇದು ಪಠ್ಯ ಡೇಟಾವನ್ನು ಪಾರ್ಸಿಂಗ್ ಮಾಡುವುದನ್ನು ಹೆಚ್ಚು ಸುಲಭಗೊಳಿಸುತ್ತದೆ:
df.select_dtypes("string")
ಹಿಂದೆ, ಹೆಸರುಗಳನ್ನು ಸ್ಪಷ್ಟವಾಗಿ ಸೂಚಿಸದೆ ಸಾಲು ಕಾಲಮ್ಗಳನ್ನು ಆಯ್ಕೆ ಮಾಡಲಾಗುತ್ತಿರಲಿಲ್ಲ.
ಹೊಸ ಪ್ರಕಾರಗಳ ಬಗ್ಗೆ ನೀವು ಇನ್ನಷ್ಟು ಓದಬಹುದು
ಓದಿದ್ದಕ್ಕೆ ಧನ್ಯವಾದಗಳು! ಈಗಾಗಲೇ ಹೇಳಿದಂತೆ ಬದಲಾವಣೆಗಳ ಸಂಪೂರ್ಣ ಪಟ್ಟಿಯನ್ನು ವೀಕ್ಷಿಸಬಹುದು
ಮೂಲ: www.habr.com