Solution HiDC pour construire une infrastructure TIC moderne pour les centres de données basée sur les équipements Huawei Enterprise

Après avoir examiné toutes les solutions modernes de Huawei Enterprise présentées en 2020, nous passons à des histoires plus ciblées et détaillées sur des idées et des produits individuels qui peuvent servir de base à la transformation numérique des grandes entreprises et des agences gouvernementales. Aujourd'hui, nous parlons des concepts et des technologies sur lesquels Huawei propose de construire des centres de données.

Solution HiDC pour construire une infrastructure TIC moderne pour les centres de données basée sur les équipements Huawei Enterprise

À l’ère du monde connecté, les défis liés au stockage et au traitement des données nécessitent de nouvelles approches à toutes les étapes du cycle de vie des centres de données. Ils doivent à la fois devenir plus simples et plus intelligents afin de pouvoir assumer leur rôle d’éléments centraux de l’infrastructure de l’économie numérique mondiale.

En 2018, l’humanité stockait 33 zettaoctets d’informations, mais d’ici 2025, son volume total devrait plus que quintupler. Trois décennies d'expérience dans le développement d'infrastructures TIC ont permis à Huawei de bien se préparer au « tsunami de données » croissant et de proposer à ses partenaires et clients le concept d'un centre de données intelligent, incluant toutes les étapes de sa construction, de son exploitation et de sa maintenance. Les éléments de ce concept sont réunis sous le nom général HiDC.

Solution HiDC pour construire une infrastructure TIC moderne pour les centres de données basée sur les équipements Huawei Enterprise

Numérisez-le

Une nouvelle blague circule sur Internet : qui a le plus accéléré la transformation numérique de votre entreprise : PDG, CTO, conseil d'administration ? Épidémie de corona virus! Seul le paresseux n’organise pas de webinaires, n’écrit pas d’articles, ne dit pas aux gens comment et quoi faire. Mais ce sont toutes des actions réactives. Certains préparés à l'avance.

Ce n'est pas pour nous vanter - pour des raisons objectives, nous prendrons comme exemple notre entreprise, dans laquelle la transformation numérique a été initiée à grande échelle il y a plusieurs années. Actuellement, nous sommes en mesure de transférer presque tous nos employés vers le travail à domicile sans aucune perte d'efficacité. L’histoire d’un hôpital construit dans la ville de Wuhan en dix jours est révélatrice. Là-bas, la transformation numérique s'est manifestée par le fait que tous les systèmes informatiques ont été déployés en trois jours. La transformation numérique n’est donc pas une question de « quand » et de « pourquoi », mais plutôt de « comment ».

Solution HiDC pour construire une infrastructure TIC moderne pour les centres de données basée sur les équipements Huawei Enterprise

Approche architecturale au lieu d’un développement spontané

Quels sont les principaux problèmes auxquels nous sommes confrontés lorsque nous commençons à construire un certain système ? Jusqu'à présent, tous nos clients travaillent dans un mode combinant des tâches métier avec des services applicatifs et des solutions informatiques. Il est assez difficile de se faire une idée générale du fonctionnement d'un tel complexe s'il a été créé simplement en ajoutant divers blocs. Et pour construire un système comme un organisme unique, une approche architecturale est d’abord nécessaire. C'est ce que nous avons incarné dans l'idéologie de notre solution HiDC.

Solution HiDC pour construire une infrastructure TIC moderne pour les centres de données basée sur les équipements Huawei Enterprise

Valeur maximale et coût minimum

L'ensemble de la structure HiDC est composé de deux tranches principales. Le premier est ce que vous avez l'habitude de voir chez Huawei : une infrastructure classique. Les éléments de la deuxième tranche se combinent le plus facilement avec le terme « données intelligentes ».

Pourquoi est-ce nécessaire ? De nos jours, de nombreuses entreprises accumulent des quantités colossales d’informations, souvent dispersées ou accessibles via divers types de « joints ». Oui, prenez au moins des bases de données ordinaires. Demandez à vos administrateurs de bases de données comment ces bases de données s'articulent et comment utiliser leurs informations dans les systèmes BI pour prendre des décisions commerciales. Étonnamment, les bases de données sont souvent très vaguement connectées les unes aux autres et fonctionnent comme des « îles » distinctes. Par conséquent, nous avons tout d’abord réfléchi aux approches architecturales qui pourraient éliminer ce problème.

Solution HiDC pour construire une infrastructure TIC moderne pour les centres de données basée sur les équipements Huawei Enterprise

Principes de conception de l'architecture HiDC

Examinons les principes de base de la conception HiDC. Cela sera principalement utile non pas aux spécialistes d'un domaine particulier, mais aux architectes de solutions capables d'appréhender l'ensemble du panorama.

Les plus courants sont le bloc réseaux convergés et le bloc gestion des données. Et voici un concept auquel les architectes de solutions pensent rarement : la gestion du cycle de vie des données. Des bases de données classiques, elle a migré vers de nombreux autres systèmes, notamment le cloud et l’edge computing.

L'informatique de pointe est de plus en plus courante. L'exemple le plus évident de leur utilisation est une voiture équipée d'un pilote automatique, qu'il est conseillé de contrôler depuis une seule plateforme. En outre, il existe une tendance vers les technologies « vertes », c'est-à-dire plus économes en énergie, causant un minimum de dommages à l'environnement. Vous pouvez réaliser les deux en passant aux ressources intellectuelles (nous y reviendrons plus tard).

C'est formidable d'avoir à notre disposition les six blocs de la structure HiDC. Certes, les clients travaillent souvent dans un environnement préalablement créé. Cependant, utiliser ne serait-ce qu’un seul bloc du diagramme ci-dessus peut porter ses fruits. Et si vous en ajoutez un deuxième, un troisième, etc., un effet synergique commencera à apparaître. La combinaison du réseau et du stockage distribué à elle seule produira des performances plus élevées et une latence plus faible. L'approche par blocs nous permet de nous développer non pas de manière chaotique, comme cela arrive souvent dans l'industrie, mais en utilisant une approche architecturale intégrée. Eh bien, l'ouverture des blocs eux-mêmes offre la liberté de choisir la solution optimale.

Solution HiDC pour construire une infrastructure TIC moderne pour les centres de données basée sur les équipements Huawei Enterprise

L’heure des réseaux convergés

Récemment, sur les marchés mondiaux et russes, nous promouvons de plus en plus le concept de réseaux convergents. Aujourd'hui déjà, nos clients utilisent des solutions convergées basées sur RoCEv2 (RDMA over Converged Ethernet v2) pour créer des systèmes de stockage distribués définis par logiciel. Le principal avantage de cette approche est son ouverture et l’absence de nécessité de créer un nombre indéfini de réseaux disparates.

Pourquoi cela n’a-t-il pas été fait avant ? Rappelons que la norme Ethernet a été développée en 1969. En un demi-siècle, de nombreux problèmes ont été accumulés, mais Huawei a appris à les résoudre. Désormais, grâce à un certain nombre d'étapes supplémentaires, nous pouvons utiliser Ethernet pour des applications critiques, des solutions à forte charge, etc.

Solution HiDC pour construire une infrastructure TIC moderne pour les centres de données basée sur les équipements Huawei Enterprise

Du DCN au DCI

La prochaine tendance importante est l’effet synergique de la mise en œuvre de DCI (Data Center Interconnect). En Russie, contrairement à la Chine, on ne peut trouver quelque chose de similaire qu’auprès des opérateurs de télécommunications. Lorsque les clients envisagent des solutions de mise en réseau pour le centre de données, ils ne prêtent généralement pas suffisamment attention à l'intégration approfondie des réseaux optiques et des solutions IP classiques au sein d'un seul point de présence. Ils utilisent des solutions familières qui fonctionnent sur la couche IP, ce qui leur suffit.

A quoi sert DCI alors ? Imaginez que l'administrateur du nœud DWDM et l'administrateur réseau agissent indépendamment. À un moment donné, un échec dans l’un d’entre eux peut sérieusement réduire votre résilience. Et si l'on utilise le principe de synergie, le routage IP s'effectue en tenant compte de ce qui se passe sur le réseau optique. L'utilisation d'un tel service intelligent augmente considérablement le nombre de neuf dans le niveau de disponibilité de l'ensemble du système.

Un autre avantage sérieux de notre DCI est sa grande marge de performance. En résumant les capacités des gammes C et L, vous pouvez obtenir environ 220 lambdas. Il est peu probable qu'une telle réserve soit rapidement épuisée, même par une grande entreprise cliente, étant donné que notre solution actuelle permet de transmettre jusqu'à 400 Gbit/s via chaque lambda. Dans le futur, il sera possible d’atteindre 800 Gbit/s sur le même équipement.

Une commodité supplémentaire est fournie par la gérabilité globale que nous offrons via des interfaces classiquement ouvertes. NETCONF gère non seulement les commutateurs, mais également les dispositifs de multiplexage optique, ce qui permet d'atteindre une convergence à tous les niveaux et de percevoir le système comme une ressource intellectuelle, et non comme un « ensemble de boîtiers ».

Solution HiDC pour construire une infrastructure TIC moderne pour les centres de données basée sur les équipements Huawei Enterprise

L'informatique de pointe est de plus en plus importante

De nombreuses personnes ont entendu parler de Edge Computing. Et ceux qui sont impliqués dans le cloud et les centres de données classiques doivent garder à l’esprit que nous avons récemment assisté à une sérieuse évolution vers l’edge computing.

Quelle est la cause de cela ? Examinons les modèles de déploiement courants. On parle beaucoup aujourd’hui de « villes intelligentes », de « maisons intelligentes », etc. Ce concept permet au promoteur de créer de la valeur ajoutée et d’augmenter le prix du bien immobilier. Une « maison intelligente » identifie son résident, le laisse entrer et sortir et lui fournit certains services. Selon les statistiques, ces services ajoutent environ 10 à 15 % au prix des appartements et, en général, peuvent stimuler le développement de nouveaux modèles économiques. En outre, nous avons déjà parlé des concepts de pilote automatique. Bientôt, le développement des technologies 5G et Wi-Fi 6 offrira une latence extrêmement faible pour le transfert de données entre les maisons intelligentes, les voitures et le principal centre de données qui effectue l'informatique de pointe. Cela signifie qu'il sera possible d'effectuer un nombre beaucoup plus important d'opérations liées à un traitement sérieux des données. Pour résoudre de tels problèmes, il est notamment possible d'utiliser des processeurs neuronaux déjà fournis en Russie.

La promesse de la tendance que nous venons d’évoquer est indéniable. Imaginons, par exemple, un système intelligent de gestion des transports urbains capable de commuter les feux de circulation, de réguler la charge de trafic dans des rues spécifiques ou même de prendre des mesures adéquates en cas d'urgence.

Solution HiDC pour construire une infrastructure TIC moderne pour les centres de données basée sur les équipements Huawei Enterprise

Passons maintenant aux ressources avec lesquelles nous assurons la mise en œuvre du concept HiDC.

Calculs

Lorsque nous devons mettre en œuvre un système informatique standard, des processeurs à architecture x86 y sont bien entendu utilisés. Mais dès que le besoin de personnalisation se fait sentir, il est temps de réfléchir à des solutions plus diversifiées.

Par exemple, les processeurs ARM, en raison de leur grand nombre de cœurs, sont excellents pour les applications hautement parallèles. Le multithreading donne un gain de performances d'environ 30 %.

Lorsqu’une faible latence est critique, les circuits intégrés logiques programmables sur site (FPGA) sont au premier plan.

Les processeurs neuronaux sont principalement nécessaires pour résoudre des problèmes d’apprentissage automatique. Si pour une implémentation spécifique nous avons besoin de 16 racks de 8 serveurs chacun, remplis de processeurs neuronaux, alors une solution du même niveau basée sur l'architecture x86 nécessiterait (!) environ 128 racks. Comme vous pouvez le constater, la grande variété de types de calcul nécessite une sélection minutieuse des plates-formes matérielles.

Solution HiDC pour construire une infrastructure TIC moderne pour les centres de données basée sur les équipements Huawei Enterprise

Stockage de données

Pour la deuxième année déjà, Huawei fait appel à ses partenaires, clients et collègues du secteur pour construire des systèmes de stockage de données selon le principe Flash Only. Et la plupart de nos clients utilisent des entraînements de broche mécaniques uniquement dans des solutions plus anciennes ou pour des données d'archives rarement utilisées.

Les systèmes Flash évoluent également. Des systèmes de mémoire de classe de stockage (SCM) tels qu'Intel Optane font leur apparition sur le marché. Les constructeurs chinois et japonais font preuve d’évolutions intéressantes. Actuellement, SCM est supérieur à toutes les autres solutions en termes de classe de traitement. Jusqu'à présent, seul leur coût élevé ne permet pas de les utiliser partout.

Dans le même temps, nous constatons que la qualité des systèmes de stockage doit être améliorée non seulement sur le backend conventionnel, mais également sur le frontend. Désormais, de facto, dans les nouvelles implémentations, nous proposons et utilisons généralement des mécanismes d'accès direct à la mémoire via Ethernet, mais nous voyons les demandes des clients et donc, vers la fin de l'année, nous commencerons à utiliser plus souvent NVMe sur Fabrics. De plus, de bout en bout, afin de fournir une architecture commune, qui doit bien entendu être performante et résistante aux pannes de contrôleur.

Le système de stockage OceanStor Dorado est l'un de nos produits phares. Des tests internes ont montré qu'il offre des performances de 20 millions d'IOPS, conservant ainsi la fonctionnalité lorsque sept contrôleurs sur huit tombent en panne.

Pourquoi tant de puissance ? Regardons la situation actuelle. Depuis plusieurs mois, les résidents chinois passent beaucoup plus de temps chez eux en raison du confinement. À cette époque, le trafic Internet a augmenté en moyenne de 30 %, et a même doublé dans certaines provinces. La consommation d'une variété de services réseau a augmenté. Et à un moment donné, ces mêmes banques ont commencé à subir une charge supplémentaire importante, pour laquelle leurs systèmes de stockage n'étaient pas prêts.

Il est clair que tout le monde n’a pas besoin de 20 millions d’IOPS à l’heure actuelle. Mais que va-t-il se passer demain ? Nos systèmes intelligents maximisent tout le potentiel des processeurs neuronaux afin de garantir la compacité du trafic, la déduplication, l'optimisation et la récupération rapide des données.

Réseau fédérateur

2020, comme nous l’évoquions dans l’article précédent, sera pour nous l’année des réseaux centraux. De nombreux clients, notamment les fournisseurs de services applicatifs (ASP) et les banques, réfléchissent déjà à la manière dont leurs applications fonctionneront, notamment en termes de communications vers et entre les centres de données. C'est là qu'un nouveau réseau fédérateur nous vient en aide. A titre d'exemple, prenons les plus grandes banques chinoises qui sont passées à des systèmes de base simplifiés qui utilisent non pas une douzaine de protocoles différents pour la communication entre les centres de données, mais, relativement parlant, quelques-uns - OSPF et SRv6. De plus, l'organisation reçoit le même ensemble de services.

Solution HiDC pour construire une infrastructure TIC moderne pour les centres de données basée sur les équipements Huawei Enterprise

Ressources intellectuelles

Comment utiliser les données ? Jusqu'à récemment, il existait un système fragmenté de bases de données hétérogènes : Microsoft SQL, MySQL, Oracle, etc. Pour travailler avec elles, on utilisait des solutions du domaine du big data, capables de combiner ces données, de les récupérer, de travailler avec elles. Tout cela créait une charge importante sur les ressources.

Dans le même temps, il n'existait aucun mécanisme permettant d'effectuer des opérations avec des données lors de la survenance d'un événement. La solution a été le développement de principes de gestion du cycle de vie des données (DLM).

Tout le monde a entendu parler des lacs de données. Avec la transition de la gestion des données à la gouvernance des données, les « lacs numériques » ont commencé à devenir rapidement plus intelligents. Y compris grâce aux solutions Huawei. Dans les documents suivants, nous parlerons certainement de l'ensemble des technologies logicielles que nous avons utilisées. Il est désormais important de noter que c'est l'utilisation de la gestion intelligente du cycle de vie des données qui nous a permis de simplifier l'utilisation de notre réseau et de nos serveurs, ainsi que d'apprendre à construire des architectures de bout en bout pour mieux comprendre les principes de travail avec les données. .

Solution HiDC pour construire une infrastructure TIC moderne pour les centres de données basée sur les équipements Huawei Enterprise

Infrastructure d'ingénierie de centre de données

Nous publierons des documents séparés consacrés à l'infrastructure d'ingénierie, mais dans le contexte du sujet d'aujourd'hui, nous aimerions mentionner les changements liés au concept HiDC.

Pendant longtemps, l'utilisation de batteries au lithium dans les systèmes d'alimentation de secours et de secours (ESP) des centres de données a été interdite en raison de leur risque élevé d'incendie. Tout dommage mécanique ou violation de l'intégrité de la batterie pourrait entraîner son incendie et des conséquences imprévisibles. À cet égard, le PSA était équipé de batteries à l'acide obsolètes, présentant une faible densité de charge spécifique et une masse importante.

Les nouveaux systèmes d'alimentation de secours et de secours de Huawei utilisent des batteries au lithium fer phosphate (LFP) sûres avec une gestion proactive intelligente. A capacité égale, elles occupent trois fois moins de volume que les batteries à acide. Leur cycle de vie est de 10 à 15 ans, ce qui réduit, entre autres, l'impact qu'ils créent sur l'environnement. Le système de contrôle breveté de l'écosystème SmartLi permet l'utilisation de systèmes hybrides composés d'anciens et de nouveaux types de batteries, et le système de commutation permet des modifications « à chaud » de la structure PSA tout en maintenant la fonction de redondance.

Solution HiDC pour construire une infrastructure TIC moderne pour les centres de données basée sur les équipements Huawei Enterprise

Fonctionnement intelligent

Une partie importante des principes de fonctionnement de l’infrastructure HiDC est l’idéologie de l’auto-guérison intelligente. DANS одной Dans nos publications précédentes, nous avons mentionné la plateforme intelligente O&M 1-3-5, capable non seulement de détecter et d'analyser un événement indésirable dans le système, mais également d'offrir à l'administrateur plusieurs options pour une solution entièrement automatisée au problème.

La fonction d'auto-analyse vous permet de détecter les problèmes en une minute environ. Trois minutes sont consacrées à l'analyse et, en cinq minutes, des propositions sont formulées pour changer l'état du système.

Disons qu'une erreur de l'opérateur a conduit à la formation d'une boucle fermée de processus, réduisant les performances de la ferme de virtualisation de 100 à 77 %. L'administrateur du centre de données reçoit un message correspondant sur son tableau de bord, qui contient une visualisation complète du problème, y compris un schéma de réseau des ressources affectées par le processus indésirable. Ensuite, l'administrateur peut procéder à la correction manuelle de la situation ou utiliser l'un des nombreux scénarios de récupération automatique qui lui sont proposés.


Le système connaît environ 75 scénarios de ce type pouvant être mis en œuvre en moins de dix minutes et couvrant 90 % des problèmes rencontrés dans les centres de données. À ce moment-là, l'ingénieur peut répondre calmement aux appels des clients inquiets, sûr que le service sera rétabli à tout moment.

Solution HiDC pour construire une infrastructure TIC moderne pour les centres de données basée sur les équipements Huawei Enterprise

Nouveaux produits clés dans HiDC

Outre les produits logiciels, cela devrait inclure des solutions clés fonctionnant au niveau de l'infrastructure. Tout d'abord, nous devons mentionner les processeurs neuronaux utilisés dans notre famille Atlas de clusters d'IA, ainsi que les serveurs basés sur NPU et GPU.

De plus, nous ne pouvons manquer de mentionner à nouveau le Dorado et ses performances de pointe, qui dureront pendant de nombreuses années. Cela est particulièrement vrai dans l'espace post-soviétique, où, à de rares exceptions près, il est d'usage de mettre à jour quelque chose uniquement lorsqu'il cesse complètement de fonctionner. Cela explique la durée de vie des systèmes de stockage individuels, qui atteint dix ans. Une énorme productivité est nécessaire pour que Dorado puisse assurer une prestation de services de haute qualité dans dix ans.

Solution HiDC pour construire une infrastructure TIC moderne pour les centres de données basée sur les équipements Huawei Enterprise

L'innovation dans chaque élément

Lors du choix de solutions d'infrastructure spécifiques, nous ne devons pas oublier l'architecture et les scénarios de son développement ultérieur. Des produits disparates provenant de différents fabricants ne garantissent pas l’effet synergique attendu que procureront des solutions déjà optimisées pour une utilisation conjointe.

L'infrastructure doit être basée sur la bonne technologie. Les « corrects » incluent les ouverts, offrant un débit élevé, fonctionnant de manière stable sous des charges élevées. Pour les centres de données, par exemple, un bon rapport entre la consommation totale d'énergie et la charge informatique est important. Pour atteindre tous les objectifs ci-dessus, vous devez sélectionner l'environnement et les composants. Dans les conditions modernes, cela signifie également l’utilisation de plus en plus répandue de l’intelligence artificielle.

D’après nos observations, parmi les clients stratégiques de Huawei, il y en a de moins en moins qui n’utilisent toujours pas de systèmes d’apprentissage automatique. Sans ML, il est tout simplement impossible de monétiser autant que possible les données accumulées.

Le système de monétisation peut être différent : pour les banques - proposant de nouveaux produits ciblés, pour les opérateurs télécoms - fournissant des services individuels et garantissant la fidélité, pour les clients gouvernementaux - une gestion du cycle de vie des données de haute qualité et un niveau élevé d'interaction avec d'autres organisations. Après tout, les modèles de gestion des données vont depuis longtemps au-delà de la mise en place d’un pare-feu et de la garantie d’une visibilité réseau de leurs bases de données.

De l’idée à l’exploitation du data center

La construction d’un centre de données standard prend au mieux entre un an et un an et demi. Notre cycle de production nous permet de le faire beaucoup plus rapidement grâce à l'utilisation d'un groupe de solutions réunies sous le nom commun FusionDC 2.0. La conception, le développement de la conception de haut niveau, l'assemblage de tous les éléments de la charge informatique sont réalisés directement en usine. En peu de temps, l'équipement est livré par conteneurs maritimes de la Chine vers la Russie. En conséquence, la création d'un centre de données clé en main peut être réalisée en quatre à cinq mois.

L’idée d’un data center cloud préfabriqué est également intéressante car un data center peut être développé par étapes, en y ajoutant les blocs fonctionnels nécessaires. Cette approche est intégrée dans le concept HiDC lui-même.


Afin de ne pas transformer le matériel de révision en fiche technique, pour plus d'informations sur HiDC, nous vous suggérons d'aller sur à notre site Web. Vous y trouverez une description et des exemples de mise en œuvre des approches, produits et solutions dont nous avons parlé. Plus votre niveau d'accès au site est élevé, plus il y aura de matériel. Si le statut de « partenaire » vous est attribué, vous pourrez télécharger des feuilles de route HiDC, des présentations techniques, des vidéos.

Nous oserions supposer que la majorité de ceux qui lisent cet article possèdent les compétences d’architectes de réseaux. Ils seront certainement intéressés à visiter notre zone de conception. Nous y expliquons en détail comment construire une infrastructure réseau selon les règles de Huawei Validated Design (HVD). Les directives disponibles en téléchargement vous aideront à bien comprendre le fonctionnement des solutions de l’entreprise. N'oubliez pas que sans autorisation, moins de matériel sera disponible.

***

De nombreux webinaires organisés non seulement dans le segment russophone, mais également au niveau international vous aideront également à vous y retrouver. Sur eux, nous partageons à la fois des informations sur nos produits et nos pratiques commerciales. Nous parlons également de la façon dont Huawei, malgré la perturbation de nombreuses chaînes de services, continue d'assurer la livraison continue de ses produits dans différents pays. Récemment, par exemple, il y a eu un cas où un équipement nouvellement produit pour un centre de données est arrivé à un client moscovite en seulement trois semaines.

La liste des webinaires du mois d'avril est disponible lien.

Source: habr.com

Ajouter un commentaire