Когда молчат ONT: 3 метода, чтобы локализовать аварию в GPON

от автора

Привет, Хабр! Меня зовут Виктор Шумилов, я ведущий сетевой инженер РТК-Сервис. В повседневной практике эксплуатации и технической поддержки телекоммуникационных сетей мы регулярно сталкиваемся с широким спектром инцидентов, напрямую влияющих на доступность сервисов, от единичных сбоев до массовых отказов. Причины таких ситуаций разнообразны: естественное старение оборудования, программные аномалии, внешние механические или климатические воздействия, а также ошибки конфигурации. Несмотря на то, что в распоряжении у нашей команды поддержки имеется обширный набор диагностических утилит и отработанных процедур, главной экспертной задачей остаётся точная и оперативная локализация аварии.

В современных сетевых архитектурах практически любое оборудование или участок сети представляют из себя группу элементов, взаимодействующих через определенную среду передачи данных. И неисправность в одной точке неизбежно отражается на работе смежных сегментов. Именно поэтому умение быстро определить масштаб инцидента, выделить проблемный участок сети и корректно интерпретировать диагностические данные становится критически важным навыком. От скорости и точности локализации проблемного участка напрямую зависят время восстановления сервисов, соблюдение SLA и общая устойчивость сети оператора.

В данной статье мы рассмотрим практические подходы к локализации неисправностей в сетях доступа GPON FTTH на примере оборудования Huawei линейки MA58xx. Поскольку технология GPON является достаточно устаревшей (ITU-T G.984.1, approval date 2008-03-29) и подробно описана в различных источниках, мы остановимся только на тех моментах, которые необходимо «подсветить» для обозначенной темы. 

Нюансы структуры сети и оборудования

Для выявления конкретного участка или точки, где находится источник аварии, требуется понимание сети и оборудования. Структура сети GPON (Gigabit Passive Optical Network) включает три основных элемента:

1.             OLT (Optical Line Terminal). Оборудование центрального узла сети доступа GPON. Типичный представитель из линейки Huawei MA5800 — OLT SmartAX МA5800-X7.

Важный момент. Аппаратная архитектура OLT, как правило, модульная (исключением могут быть моноблочные 1U pizza-OLT), где модули-платы отвечают за определенный функционал и объединены через backplane. Таким образом, OLT можно условно разделить на два основных сегмента[1] – платы управления с uplink портами, и сервисные платы с PON интерфейсами. Типичный пример — MA5800-X7:

1.             ONU (Optical Network Unit). В решении GPON FTTH — это абонентский терминал ONT (Optical Network Unit). Типичный пример – HG8245W5:

 Кроме того, возможно условное разделение на два сегмента – WAN (оптический PON uplink интерфейс) и LAN (электрические GE интерфейсы):

1.             ODN (Optical Distribution Network). Оптическая сеть PON состоит из таких элементов как кроссы, сплиттера, кабели, муфты и разъёмы. И здесь также можно выделить основные сегменты:

  • Фидерный (магистральный): от OLT на центральной станции до узла распределения (сплиттер L1, FDT);

  • Распределительный: от узла распределения к точкам доступа абонентов (сплиттер L2, FAT, FDB)

  • Абонентский (drop): от точки доступа к терминалу внутри помещения абонента.

Если скомбинировать вышеописанную информацию на одну схему, то получим следующие участки и точки для локализации аварий на сети GPON:

Нюансы технологии

Понимание технологии позволит выявить узкие места на сети еще до момента возникновения проблемы. При этом можно заранее описать проблему по основным признакам и возможному источнику.

  1. Особенностью GPON является разделяемая среда передачи данных по топологии «точка-многоточка», когда один PON интерфейс обеспечивает подключение до 128 абонентов (ONT) через сплиттеры. При этом приём и передача осуществляется на разных длинах волн (Downstream 1490 nm/Upstream 1310 nm) с использованием одного оптического волокна. Основные классы оптических приемников — CLASS B+ (- 8 dBm/-28 dBm) и CLASS С+ (-12 dBm/-30dBm).

Примеры возможных аварий:

2. Технология GPON обеспечивает асимметричную скорость (Downstream 2.488 Gbps/Upstream 1.244 Gbps) передачи данных и динамическое управление полосой пропускания (DBA).

Примеры возможных аварий:

1.             Технология GPON обеспечивает совместимость OLT и подключаемых терминалов ONT разных вендоров (интероперабельность).

Примеры возможных аварий:

Методы локализации  

Используемые методы являются общеизвестными, поэтому здесь интерес представляет особенность их применения в условиях специфики сети GPON. При этом выбор метода зависит от контекста проблемы. Так, для локализации простых или типовых проблем будет достаточно проанализировать информацию по авариям/событиям/операциям, но в случае комплексных инцидентов, может потребоваться дополнительный и более широкий анализ с использованием принципов сравнения или исключения. Таким образом, сочетание различных методов позволит локализовать проблему в более короткий интервал времени, что может быть важно для соблюдения SLA. 

Рассмотрим применение наиболее часто используемых методов на примерах.

1.    Анализ аварийных сообщений

Одним из эффективных методов локализации проблемы является анализ сообщений по авариям или событиям. В ряде случаев в них содержится исчерпывающая информация по инциденту, включающая детали по возможному источнику и месту аварии. Например, обращение абонента с жалобой на отсутствие всех сервисов.

Схема:

Анализ:

·  Поскольку обращение единичное, то проверим наличие активных аварий по данному абоненту:

 OLT(config)#display alarm active alarmparameter 0/2/0 5  

{ <cr>|detail<K>|list<K>||<K> }:

  Command:

          display alarm active all

 ....

  ALARM 727203 FAULT WARNING 0x2e112007 SERVICE QUALITY 2026-02-19 06:47:25+05:00

  ALARM NAME  : The distribute fiber is broken or the OLT cannot receive expected optical signals from the ONT(LOSi/LOBi)

  SRVEFF      : SA

  PARAMETERS  : FrameID: 0, SlotID: 5, PortID: 10, ONT ID: 45, Equipment ID: PSG-590            

  DESCRIPTION : The OLT cannot receive expected optical signals from the ONT in four consecutive frames

  CAUSE       : (1) The fiber is broken

(2) The quality of the optical path is poor

(3) The ONT hardware fails

  ADVICE      : (1) Check tributary optical fiber connection and backbone optical fiber orderly, clean the fiber connector

  and replace the fiber if necessary

(2) Ensure that the optical attenuation of the optical path is normal

(3) Reset the ONT or replace the ONT

  --- END

Как видно из сообщения, OLT не получает ожидаемый оптический сигнал от ONT или имеет место обрыв волокна. Таким образом, источник проблемы находится на участке между сплиттером и ONT абонента. При этом ONT также «под подозрением».  

Для дальнейшего анализа проблемы потребуется выезд инженера для определения конкретного места возникновения проблемы (повреждение распределительного или абонентского кабеля, загрязнение на разъёме, неисправность PON интерфейса ONT и т.д.).

2. Метод сравнения

Суть метода заключается в последовательной оценке масштаба влияния проблемы на каждом участке сети. Например, групповая проблема (ГП) от абонентов с жалобой на отсутствие интернет-доступа.

Схема:

Чек-лист:  

  • Абоненты ГП принадлежат одной OLT или нескольким? 

o   Вариант 1. Если нескольким OLT, значит проблема на вышестоящей сети или BRAS (точка 1).

o   Вариант 2. Если одной OLT, значит анализируем работу плат и интерфейсов данной OLT.

  • Абоненты ГП принадлежат одной плате PON или нескольким?

o   Вариант 1. Если нескольким платам PON, значит проблема на плате управления или uplink OLT (точка 2).

o   Вариант 2. Если одной плате PON, значит анализируем работу PON интерфейсов данной платы.

  • Абоненты ГП принадлежат одному PON интерфейсу или нескольким?

o   Вариант 1. Если нескольким PON интерфейсам, значит проблема непосредственно на плате PON (точка 3).

o   Вариант 2. Если одному PON интерфейсу, значит анализируем данный интерфейс и подключенные ONT.

  • Абоненты ГП принадлежат одному L2 сплиттеру или нескольким?

o   Вариант 1. Если нескольким L2 сплиттерам, значит проблема непосредственно на PON интерфейсе или фидерном участке до сплиттера L1 (точка 4).

o   Вариант 2. Если одному L2 сплиттеру, значит последовательно анализируем распределительный и абонентский участки ODN от сплиттера до абонентов (точки 5 и 6).

3.  Метод исключения

Отличием данного метода является то, что при анализе исключаются избыточные участки сети, где проблема не фиксируется. Например, обращение абонента с жалобой на отсутствие интернет-доступа. При этом абонент подключен по схеме с ONT в режиме роутера.

Схема:

Анализ:

  • Фиксируются ли MAC-адреса с вышестоящего агрегатора в VLAN HSI на uplink OLT?

o   Вариант 1. Если нет, значит проблема на вышестоящей сети или uplink OLT.

o   Вариант 2. Если да, значит исключаем участок uplink.

  • Фиксируются ли MAC-адрес абонента в VLAN HSI на PON интерфейсе?

o   Вариант 1. Если нет, значит проблема на OLT, ODN или ONT[2].

o   Вариант 2. Если да, значит исключаем OLT и ODN.

  • Установлено ли WAN соединение (PPP/DHCP) на ONT?

o   Вариант 1. Если нет, значит необходима диагностика в отношении используемого протокола на стороне терминала (в ряде случаев и на стороне сервера).

o   Вариант 2. Если да, значит исключаем WAN.

  • Получен ли IP на ПК абонента?

o   Вариант 1. Если нет, значит проблема на ПК абонента или на участке подключения ПК к ONT.

o   Вариант 2. Если да, значит проблема в ПК абонента.

Примеры функционала и неисправностей

1.    Состояние плат и uplink интерфейсов OLT

  • Команда: display board 0

Пример вывода:

Проблема и локализация: неисправная плата GPON в слоте 0/1.

  • Команда: display board 0/{slot}

Пример вывода:

Проблема и локализация: оптический 10GE SFP модуль установлен в uplink порт 0/9/0, но при этом физический линк в статусе offline.  

  • Команда: {interface} display port ddm-info {port}

Пример вывода:

Проблема и локализация: на uplink порте 0/9/0 отсутствует оптический сигнал на приёме.

1.    Состояние GPON интерфейсов

  • Команда: {interface} display port state all

Пример вывода:

Проблема и локализация: на uplink порте 0/9/0 отсутствует оптический сигнал на приёме.

1.    Состояние GPON интерфейсов

  • Команда: {interface} display port state all

Пример вывода:

Проблема и локализация: оптический GPON SFP модуль не установлен в порт 0/6/1.

1.    Состояние ONT

  • Команда: display ont info summary 0/{slot}

Пример вывода:

Проблема и локализация: ONT 0/2/52 в статусе offline по причине отключения электропитания (dying-gasp).   

  • Команда: {interface} display ont info {port} all

Пример вывода:

Проблема и локализация: ONT 1, включенная в GPON порт 0/3/0, не применила конфигурацию.

  • Команда: {interface} display ont optical-info {port} all

Пример вывода:

Проблема и локализация: низкий уровень оптического сигнала на приёме ONT 5, включенной в GPON порт 0/3/0.    

Заключение

В данной статье мы рассмотрели базовые принципы локализации аварий в сетях GPON FTTH на примере оборудования Huawei линейки MA58xx. Имеющиеся инструменты диагностики, методы и команды предоставляют командам технической поддержки широкие возможности по оценке и анализу состояний всех элементов и сегментов GPON сети: от центрального узла OLT до абонентского терминала. Применение методов анализа аварийных сообщений, сравнения и исключения в сочетании с указанными командами позволяет:

·       Быстро определить масштаб проблемы — единичный абонент, группа ONT, весь PON-интерфейс или плата целиком;

·       Точно локализовать участок сети — OLT, ODN или ONT;

·       Выявить причину проблемы.

Таким образом, системное использование рассмотренных инструментов и методов существенно сокращает время диагностики, минимизирует прерывание сервисов и способствует соблюдению SLA, что особенно критично в условиях эксплуатации сетей доступа с большим количеством абонентов.

А какой метод локализации спасал вас в самый критический момент?

[1] Если на OLT uplink порты вынесены на отдельную плату, то можно говорить о трёх сегментах.

[2] Здесь можно опционально применить метод сравнения и сопоставить статусы ONT «проблемного» абонента с другими ONT на данном PON интерфейсе для локализации проблемного участка ODN

ссылка на оригинал статьи https://habr.com/ru/articles/1040844/